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Avant-propos 


Ce manuel de cours est destiné principalement aux étudiants de la Licence économie et 
gestion mais peut être utile à toute personne souhaitant connaître et surtout utiliser les 
principales méthodes de la statistique inférentielle. Il correspond au programme de pro- 
babilités et statistique généralement enseigné dans les deux premières années de Licence 
(L1 et L2). Cette 7° édition s’est enrichie d'exercices nouveaux. Le niveau mathématique 
requis est celui de la première année de Licence, avec quelques notions (séries, intégrales 
multiples.) souvent enseignées seulement en deuxième année. 


Si une grande partie de l’ouvrage est consacrée à la théorie des probabilités, l’ordre 
des termes retenu dans le titre veut signifier qu’il ne s’agit que d’un outil au service 
de la statistique. Ce n’est qu’un passage obligé pour donner des bases rigoureuses à la 
méthode statistique. On peut le concevoir comme un ensemble de règles grammaticales, 
parfois difficiles et fastidieuses à retenir, mais qui permettent de rédiger des textes clairs, 
rigoureux et sans ambiguités, même si l’on n’a pas conscience qu'ils ont été écrits dans 
le respect de ces règles. La partie statistique correspond aux deux derniers chapitres 
d’estimation et de tests d’hypothèses. 


Les fondements théoriques de la statistique étant parfois délicats, nous avons choisi 
de présenter sans démonstration les principales propriétés nécessaires à une utilisation 
judicieuse des méthodes statistiques, en les illustrant systématiquement d'exemples. De 
même, afin de ne pas alourdir les énoncés de théorèmes, les conditions techniques de 
leur validité ne sont pas présentées dans leur détail, parfois fastidieux, et qui risque de 
masquer l’essentiel qui est la propriété énoncée. Notre souci constant a été de faciliter la 
compréhension, pour pouvoir passer aisément au stade de l’utilisation, sans cependant 
pour cela sacrifier à la rigueur. La traduction anglaise des termes les plus usuels figure 
entre parenthèses. 


Chaque chapitre se conclut par des exercices corrigés permettant de contrôler l’ac- 
quisition des notions essentielles qui y ont été introduites. Faire de nombreux exercices 
est certainement le meilleur moyen d’arriver à la compréhension de certaines notions 
quelquefois difficiles. Rappelons cette maxime chinoise : J'entends et j'oublie. Je vois 
et je retiens. Je fais et je comprends. En fin de chapitre se trouvent également quelques 
compléments ; soit de notions mathématiques utilisées dans celui-ci, la combinatoire par 
exemple, soit de propriétés comme l’exhaustivité, très importantes et utiles, mais hors 
du programme d’une Licence d'économie ou de gestion. Avec ces compléments, cet 
ouvrage peut convenir aussi aux étudiants des écoles de management. 


Notations 


Q Ensemble fondamental 

P(Q) Ensemble des parties de Q 

À, ÀA° Complémentaire de À 

À Algèbre ou tribu de parties de Q 

card A Cardinal de A 

Gi Coefficient binômial 

[x] Partie entière de x 

In x Logarithme népérien de x 

1, Indicatrice de À 

Cov (X,Y) | Covariance de X et Y 

fr. Fonction de répartition 

V.a. Variable aléatoire 

p Densité de la loi N(0,1) 
Fr. de la loi loi (0,1) 

C Ensemble des nombres complexes 

A Matrice transposée de A 

I, Matrice unité d’ordre ñn 

X + P La v.a. X suit la loi de probabilité P 

B(n, p) Loi binômiale de paramètres n et p 

P() Loi de Poisson de paramètre À 

N (m,o) Loi normale dans R, d’espérance m et d’écart type © 

N'(u,2) | Loi normale dans R”, de vecteur espérance y 
et de matrice variances-covariances Z 

T, Loi de Student à n degrés de liberté 

1° Loi du khi-deux à n degrés de liberté 

F(n,m) Loi de Fisher-Snedecor à n et m degrés de liberté 


Estimateur du maximum de vraisemblance 
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Introduction 


La statistique a une origine très ancienne, se réduisant initialement à une collecte d’ob- 
servations, notamment le dénombrement des hommes (recensement). On mentionne des 
opérations de recensement il y a plus de 4 000 ans en Chine, en Mésopotamie ou en 
Égypte et la Bible en cite plusieurs, dans le Livre des Nombres par exemple. Cependant, 
le terme statistique est apparu assez récemment, vers le milieu du XVII siècle ; il vient 
du latin sfatisticus, relatif à l’état (status), et est employé alors dans un sens purement 
descriptif de recueil ou de collection de faits chiffrés, les statistiques. Le mot employé 
au singulier avec l’article défini, la statistique, évoque la méthode utilisée ensuite pour 
étendre des résultats et dégager des lois (l’inférence). Il s’agit donc dans ce sens d’un 
moyen scientifique d’analyse et de compréhension du phénomène étudié, s’appliquant 
très largement à l’économie et à toutes les sciences sociales et de la nature. 

Cette discipline concerne donc tous ceux qui ont à relever, présenter, analyser ou uti- 
liser une information dont la masse peut être volumineuse. On peut la définir comme 
un ensemble de méthodes dont le but est de traiter des données, les statistiques, rela- 
tives à un certain domaine d’étude. Elle traite également de la manière de recueillir ces 
données, auprès de qui et sous quelle forme (théorie des sondages). Son objectif peut 
se résumer de la façon suivante : dégager, à partir de données observées sur quelques 
individus d’une population, des résultats valables pour l’ensemble de la population. 


Cela consistera par exemple à remplacer des données nombreuses par des indica- 
teurs (résumés) les plus pertinents possibles : résumé clair avec le minimum de perte 
d’information, permettant de dégager plus facilement un diagnostic. Il s’agit alors de 
la statistique descriptive qui recouvre les moyens de présenter ces données et d’en 
décrire les principales caractéristiques, en les résumant sous forme de tableaux ou 
de graphiques. Il s’agira ensuite de les interpréter. La description statistique se pro- 
pose de mettre en évidence certaines permanences ou lois statistiques, qui peuvent 
éventuellement conduire à des prévisions (élément essentiel de l’étude des séries chro- 
nologiques). Une règle qui transforme un ensemble de données en une ou plusieurs 
valeurs numériques se nomme une statistique, le terme étant cette fois utilisé avec 
Particle indéfini. 

Le début de la méthodologie statistique peut se situer au XVII° siècle qui verra éga- 
lement l’éclosion d’un outil fondamental pour une formalisation tout à fait rigoureuse, 
la théorie des probabilités, qui est l’analyse mathématique des phénomènes dans les- 
quels le hasard intervient. Le calcul des probabilités a commencé avec Blaise Pascal, 
Pierre Fermat, Christian Huygens et Jacques Bernoulli par l’analyse des jeux dits de ha- 
sard. Le mot hasard est d’ailleurs emprunté à l’arabe az-zahr (jeu de dés, alea en latin) 
au XII° siècle d’où est venue cette expression jeu de hasard au XVI° siècle. La théorie des 
probabilités servira ensuite d’outil de base à un ensemble de méthodes ou de règles ob- 
jectives permettant d'utiliser des données pour fixer la précision avec laquelle on estime 
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certains paramètres (théorie de l’estimation) ou on teste certaines hypothèses (théorie 
des tests) : la Statistique mathématique (ou inférentielle). Ceci permet d’obtenir une 
mesure objective de la distance entre un modèle statistique, traduit par une famille P, de 
lois de probabilité indexée par un paramètre @ parcourant un ensemble donné O6, et un 
ensemble de données observées. 


Tout ceci peut se synthétiser au moyen du schéma suivant : 


Données Importance de la manière de les collecter 
- (théorie des sondages) 
Présentation des données recueillies 
(statistique descriptive) 


Modélisation =» Catalogue de modèles probabilistes disponibles 
et outils nécessaires à la déduction 
(théorie des probabilités) 


Statistique mathématique : 
un modèle statistique paramétrique (P,;0 € ©) 
induction ou inférence statistique 
- estimation : quelle est le valeur de 4 ? 
- test : est-ce que 0 = 8, ou0 = 0,7? 
Il reste à préciser dans quel cadre cette formalisation à l’aide de modèles aléa- 
toires sera nécessaire. Toute démarche scientifique nécessite la réalisation de certaines 
expériences que l’on peut regrouper en deux grandes catégories : 


- Pour certaines d’entre elles, si elles sont renouvelées dans des conditions totalement 
identiques, elles produiront le même résultat, qui devient donc prévisible. II s’agit de 
phénomènes déterministes, où les faits sont régis par des lois universelles physiques 
(par exemple l’augmentation de la pression d’un gaz provoque une diminution de son 
volume, ce que traduit la loi de Mariotte : Pression x Volume = constante ; l’eau 
portée à 100 degrés Celsius se transforme en vapeur...). Le résultat est entièrement 
déterminé par les conditions de l’expérience : on peut prévoir le phénomène qui va 
se produire. 


+ Par contre, d’autres expériences ont toujours un résultat imprévisible (lancer d’un dé 
ou d’une pièce de monnaie) : effectuées dans des conditions totalement identiques 
elles donneront des résultats différents. Le résultat est non prévisible et on dit qu’il 
est dû au hasard, cette expression étant utilisée pour la première fois par Fénelon en 
1695, le mot hasard étant compris maintenant au sens absolu et philosophique comme 
«sans évolution prévisible », à opposer à déterministe. Dans son Essai philosophique 
sur les probabilités (1814), Laplace considère en effet que le déterminisme ne laisse 
aucune place au hasard : l’état de l’univers à un instant donné détermine son état 
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à tout autre instant ultérieur. Aïnsi, quand on jette une pièce de monnaie en l’air, 
les lois de la mécanique classique déterminent, en principe, avec certitude si elle 
retombera sur pile ou face. Le résultat n’est pas dû au hasard, mais à la manière dont 
elle a été lancée en l’air et à la façon dont elle va retomber sur une certaine surface ; 
mais la trajectoire décrite par cette pièce avant de retomber sur pile est tellement 
complexe qu’il n’est pas possible de prévoir son issue. Le phénomène ne relève pas 
du déterminisme entendu au sens de la possibilité de prédiction, par le calcul ou la 
loi mathématique. 


Dans un mémoire de 1774, Laplace énonce que « le hasard n’a aucune réalité en 
lui-même : ce n’est qu’un terme propre à désigner notre ignorance. La notion de 
probabilité tient à cette ignorance ». Retenir un modèle probabiliste est donc simple- 
ment un aveu de notre ignorance, de notre incapacité à fournir un modèle physique 
décrivant une réalité trop complexe. On parle alors d’épreuve ou d’expérience aléa- 
toire et le résultat obtenu sera un événement. Les outils appropriés dans ce cadre sont 
ceux de la statistique mathématique, la base de cette discipline étant la théorie des 
probabilités, que nous devrons donc étudier dans les six premiers chapitres de cet 
ouvrage, comme préalable aux deux chapitres d’estimation et de tests d’hypothèses. 


REMARQUE Dans Science et méthode publié en 1908, Henri Poincaré exprime que 
hasard et déterminisme sont rendus compatibles par l’imprédictibilité à long terme. Les 
relations entre hasard et déterminisme ont été dans les années 1980 l’objet d’une contro- 
verse animée entre les mathématiciens René Thom et Ilya Prigogine. L’étude récente 
des systèmes dynamiques montre que l’on ne peut pas confondre déterminisme et pré- 
dictibilité. En effet, une légère perturbation des conditions initiales d’un tel système 
mathématiquement déterministe peut empêcher de prévoir son évolution future. 


Chapitre 


Notion de probabilité 


ES Introduction 


Au cours de ce chapitre, nous allons donner la définition d'un certain nombre de termes 
du vocabulaire utilisé dans un contexte non déterministe et indiquer comment construire 
le modèle adéquat. La notion essentielle introduite étant bien sûr celle de probabilité, 
avec la notion d'indépendance d'événements qui lui est associée et qui joue un rôle très 
important en statistique. La représentation formelle du modèle probabiliste sous-jacent 
est presque toujours absente dans un problème concret de statistique. Cependant, cette 
formalisation rigoureuse est indispensable pour obtenir les outils théoriques nécessaires 
à la résolution d'un tel problème statistique. 


LCEPPPEE TELE EE TELE LELELE LEE TELE LE LE EEE TELE EST TELE CET EL EL TELE LEE EE EE CET ELEC EEE ELEC ELEC EL EE TELE CEE EEE EEE TETE EL EE TELE LE LEL ELEC ELEC EEE TELE 


ru O bj ectifs CPCEPEEEEECECEETEEDEECEPCEPCEPCECEEES : PA Concepts clés | ÉCEECEEPEEELECEECTEETEES ". 


È que le modèle probabiliste est 
E choisi en fonction du but que l'on 
poursuit. 


Probabilité 


Probabilité conditionnelle 


Indépendance 


de façon théorique (et non TE d 
intuitive) la notion d'indépendance. : 
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@ Modèle probabiliste 


1.1 Ensemble fondamental 


Avant toute formalisation, le résultat d’une expérience aléatoire s’appelle événement. 
La quantification des « chances » qu’un tel événement a de se réaliser correspond à la 
notion intuitive de probabilité. Pour réaliser cette quantification, il est nécessaire de 
décrire au préalable, très précisément, l’ensemble des résultats possibles, appelés évé- 
nements élémentaires. Cet ensemble expérimental s’appelle ensemble fondamental 
(ou univers) et est noté traditionnellement Q. 


Exemple 1.1 


Jet d’un dé à six faces numérotées : Q = {1, 2, 3, 4,5, 6}. 


Exemple 1.2 


On tire une boule dans une urne contenant une boule noire, deux blanches et cinq 
rouges et l’ensemble fondamental retenu est @ = {noire, blanche, rouge}. 
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Chaque élément © € Q représente donc un événement élémentaire, et toute par- 
tie À C Q (ou À € P(Q)) sera un événement. Parfois on dit que Q est l’ensemble 
des éventualités possibles et les événements élémentaires sont alors les singletons, 


N 


c’est-à-dire les ensembles réduits à un seul élément {w}, qui sont effectivement en 
toute rigueur des événements, puisque appartenant à P(Q), ce qui n’est pas le cas du 
point ©. 


Exemple 1.3 

À l'expérience du jet de dé on associe Q = {1, 2, 3, 4, 5, 6} ; l'événement À ={1, 2} 
traduit, c’est-à-dire représente symboliquement, le résultat « obtenir un résultat 
inférieur ou égal à 2 ». 


L'ensemble Q dépend évidemment de l’expérience considérée, mais aussi du choix 
de celui qui construit le modèle, et par là présente donc un certain arbitraire. 


Exemple 1.4 
Dans l’expérience du jet de dé on peut choisir également Q = {pair,impair} ou 
Q= {{1,2,3,},{4,5,6j}. 


Exemple 1.5 

Si on tire une carte d’un jeu de 32 cartes, on peut retenir comme ensembles fon- 
damentaux Q = {7,8,9,10,, D,R, As} ou Q = {frèfle, carreau, cœur, pique} ou 
Q = {rouge, noir}. 


Cet ensemble Q peut être fini ou infini, continu ou discret. 


Exemple 1.6 
On lance une pièce jusqu’à obtenir pile, l'événement retenu étant le nombre de jets 
effectués : 


Q=1{1,2,...,n,...} = N* 


ensemble infini dénombrable. 


Exemple 1.7 


On observe la durée de vie d’une lampe : 
Q=T[0,+oo[-R, 
ensemble infini non dénombrable. 


L'ensemble retenu est bien sûr une abstraction et peut parfois contenir des événements 
qui ne se produiront jamais dans la réalité. 


© Dunod — Toute reproduction non autorisée est un délit. 


Notion de probabilité 


Exemple 1.8 

On mesure la taille d’un individu choisi au hasard dans une population et on retient 
Q = R, ; cet ensemble contient de très grandes tailles qui n’existent bien sûr pas dans 
la réalité, mais en raison de la difficulté de fixer une valeur maximale de la taille pour 
définir l’ensemble fondamental, c’est le choix qui paraît le moins arbitraire. 


1.2 Algèbre et tribu d'événements 


Un événement étant un élément de P(Q) obéit à la théorie des ensembles. Nous allons 
indiquer dans le tableau ci-après comment certaines notions ensemblistes s’expriment, 
ou se traduisent, en termes d'événements. 


Ensemble Événement 
On a observé le résultat w et © € À | L'événement À est réalisé. 
A=B Les événements À et B sont identiques. 
ACB L'événement À implique l'événement B. 
ÿ Événement impossible. 
Q Événement certain. 
AUB Un au moins des deux événements est réalisé. 
AnB Les deux événements À et B sont réalisés. 
AnB=# Les événements À et B sont incompatibles. 
A=Q - A où A° L'événement À n'est pas réalisé. 


Le couple (Q, P(Q)) s’appelle un espace probabilisable. 

Cependant, même si Q est fini, le cardinal de P(Q) est 244%, qui peut être un nombre 
très grand. Dans ce cas, il peut être souhaitable de ne considérer qu’une famille res- 
treinte À de parties de Q, À € P(Q). Pour que le résultat des opérations ensemblistes 
(union, intersection, complémentaire) soit encore un événement, il est nécessaire que 
cette famille d'événements retenue soit fermée, ou stable, vis-à-vis de ces opérations, 
c’est-à-dire qu’il soit bien un élément de la famille (par exemple, si on retient la fa- 
mille des nombres impairs, elle n’est pas stable pour l’addition puisque le résultat est un 
nombre pair). De plus, les événements « certain », Q, et « impossible », Ÿ, doivent égale- 
ment appartenir à cet ensemble. Ainsi, on associera à une épreuve aléatoire un ensemble 
non vide de parties de Q, noté À, qui vérifiera : 


—|C; | pour tout À € Aalors À € À; 


—|C,; | pour tout À € Aettout B € À alors AU B € A. 


Il y a fermeture pour le complémentaire et l’union. Cet ensemble À s’ appelle une 
algèbre de parties de Q. Bien entendu, grâce aux lois de Morgan, on a une définition 
équivalente en remplaçant la condition C, par : 


— (oué pour tout À € Aet tout B € À alors ANB € A. 
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Exemple 1.9 
L’algèbre la plus élémentaire est réduite à À = {ÿ9,Q}. 


Exemple 1.10 


À partir d’un événement quelconque À, on peut constituer l’algèbre : 


A = {ÿ, A, A,Q) 


Exemple 1.11 
On peut générer une algèbre à partir d’une partition. À partir de la partition de 
Q = {a, b,c, d} en trois ensembles {a, b}, {c}, {d}, on construit l’algèbre : 


A = {ÿ, {a, b}, {c}, {d}, {a, b, c,}, {a, b, d}, {c, d},Q} 


avec card À = 2}. 


Exemple 1.12 
L’algèbre la plus complète est bien entendu P(Q). 


Théorème 1.1 ceneereeeeeeeeeeee eee eee eee eee k, 


Propriétés d'une algèbre 


P, | La famille étant non vide, on en conclut que : 


JE AQE A 


P;,|Si A; € A pour 1 K j < n, on démontre par récurrence que : 


Ua, E A 
j=1 


P;|Si 4; € A pour 1 < j < n, on démontre également par passage au 


: complémentaire que : 


Cependant, certaines expériences peuvent se dérouler indéfiniment (au moins théori- 
quement), comme par exemple lancer un dé jusqu’à obtenir le chiffre 6. Si À, représente 
l'événement « obtenir le chiffre 6 au n-ème lancer », l’événement « obtenir le chiffre 6 » 
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s’écrira À = [J*, A,. On a donc besoin de renforcer la propriété P, de fermeture pour 
l’union finie par une condition de fermeture pour l’union dénombrable, soit : 


—|C;|Si À, € À pour tout n € N alors : 


U À, € A 
n=0 


condition qui exprime que toute union dénombrable d’événements est encore un événe- 


ment. L'ensemble À auquel on impose les conditions C; et C; s’appelle alors une & — 
algèbre ou tribu d'événements. 


REMARQUE On aurait pu remplacer dans la condition C, l’union par l’intersection 
(par passage au complémentaire l’union se transforme en intersection). Bien entendu 
toute algèbre finie est une © — algèbre. 


Cependant, dans les cas simples où Q est un ensemble fini, ou éventuellement infini 
dénombrable, on peut retenir comme tribu des événements P(Q) tout entier. Ce n’est 
que dans les autres cas que l’on est amené à considérer des ensembles À plus réduits 
que P(Q) qui est alors trop vaste. Le couple formé de l’ensemble fondamental Q et de la 
tribu d’événements associée À s’ appelle un espace probabilisable. Cette terminologie 
signifie que l’on va pouvoir associer une probabilité, notée P, à ce modèle ((, 4). 


1.3 Probabilité 


Une fois défini l’ensemble des événements auxquels on s'intéresse, on va essayer de 
traduire par un nombre leurs « possibilités » de réalisation. Cela revient à affecter une 
mesure de « croyance » à chaque événement, c’est-à-dire un degré de certitude que l’on 
a que l’événement se produise ou non. Afin de correspondre à la notion intuitive, une 
probabilité sera un nombre associé à un événement, compris entre O et 1, pour pouvoir se 
convertir en pourcentage de « chances » ; l’événement certain Q se voit attribuer la pro- 
babilité 1 et l’événement impossible Ÿ la probabilité 0. Nous verrons dans l’exemple 6.6 
que cette définition axiomatique est adaptée à la réalité, puisque la fréquence observée 
d’un événement a pour limite sa probabilité ainsi définie. D’autre part, si deux évé- 
nements sont incompatibles, c’est-à-dire ne peuvent pas se réaliser simultanément, la 
probabilité de réalisation de l’un des deux sera la somme de leurs probabilités respec- 
tives (par exemple pour un jet de dé P(1 ou 2) = P(1) + P(2) = 1/6 + 1/6 = 1/3). 
D'où la définition suivante : 


DÉFINITION 


On appelle probabilité P sur (Q, 4) une application P : A — [0, 1] telle que : 
(i) PQ) =1; 
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(ii) pour toute suite À, d'événements incompatibles, soit À, € À avec À,, (1 A, =ÿ 
pourm£n: 


P(Ua)- Dre 
n=0 n=0 
propriété dite de o - additivité. 


REMARQUE Pour toute suite d'événements quelconques, c’est-à-dire non disjoints, 
on a l’inégalité de Boole : 


r( U ….) < ÿ P(4,) 
n=0 n=0 


Une probabilité est donc une application qui à un événement va associer un nombre. 
Le triplet (Q,.4, P) s’appelle un espace probabilisé. Comme conséquences de la 
définition on déduit les propriétés suivantes. 


Théorème 1-2 REEneEEereee eee eee eee 3 


P, | L'événement impossible est de probabilité nulle : 


P(9) = 0 


P, | La probabilité de l’événement complémentaire d’un événement quelconque À: 


s'obtient par : 


P(A) = 1 — P(A) 


P, | Si un événement en implique un autre, sa probabilité est plus petite : 


ACB= P(A)< P(B) 


P,|La probabilité de l’union de deux événements s'obtient par la formule E 


de Poincaré : 


P(A U B)= P(A)+ P(B)- P(A n B) 


a) Cas où Q est fini 


Si Q = {w,,...,@,}, la donnée de n nombres p,,1 < i < n, associés à chacun des 
événements élémentaires par p, = P({w;}), tels que 0 < p, < Let 2 p; =1, suffit à 
déterminer une probabilité P sur (Q, P(Q)) par : 


P(A) = Ÿ'{p,/o; € A} 


10 
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c’est-à-dire que la probabilité d’un événement quelconque À de P(Q) est définie comme 
la somme des probabilités de tous les événements élémentaires qui y sont inclus. 


b) Cas particulier : équiprobabilité 


Il s’agit d’un cas assez fréquent où tous les événements élémentaires ont la même 
probabilité, ce qui correspond à la loi uniforme discrète définie par : 


Cette particularité est souvent sous-entendue ou précisée par l’affirmation que les 
résultats de l’expérience sont obtenus au hasard. On obtient alors : 


card À 
card Q 


11 
P(A)= Ÿ == -xcard A= 
nn 
&@; EA 
puisque n = card Q. Ce résultat s’énonce souvent sous la forme très dangereuse de 
la règle énoncée par Laplace au XVIH° siècle : 


nbre de cas favorables 


P(A) = 
(4) nbre de cas possibles 


un cas favorable étant un événement élémentaire qui réalise À. On est alors ramené à un 
simple problème de dénombrement. Mais il faut bien faire attention que cette règle ne 
s’applique que dans le cas d’équiprobabilité des événements élémentaires. Si en jouant 
au loto il y a deux événements possibles, gagner ou non le gros lot, il n’y a malheureu- 
sement pas une chance sur deux pour l’événement favorable qui est de le gagner ! Cette 
règle ne peut donc en aucun cas servir de définition pour une probabilité. 


ATTENTION ! = 
C'est ici qu'il est important de bien préciser l'ensemble fondamental Q. Si par 
exemple on lance deux pièces de monnaie identiques, on pourrait être tenté de 
retenir comme ensemble fondamental Q = {PP PF FF}, mais dans ce cas il n'y au- 
rait pas équiprobabilité des événements élémentaires, car PP ou FF ne peut être 
obtenu que d'une seule façon alors que PF peut être obtenu de deux façons dlis- 
tinctes, le résultat pile pouvant être réalisé sur une pièce ou l'autre. Ces événements 
ont donc respectivement comme probabilité 1/4, 1/4 et 1/2. Il vaut donc mieux 
faire comme si les pièces étaient distinctes et retenir @Q = {PP PF FP FF} où les 
événements élémentaires sont équiprobables. 


REMARQUES 


1. Dans le cas où Q est fini, on peut toujours construire un espace probabilisé tel 
que chaque événement élémentaire, au sens de singleton, ait une probabilité nulle. Par 
exemple pour Q = {a,b,c} on choisit À = {ÿ, {a}, {b,c},Q} et la probabilité P dé- 
finie par P({a}) = 0, P({b,c}) = 1, ce qui correspond au cas de deux événements 
indiscernables, avec un seul événement élémentaire. 
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2. De même, on peut construire un espace probabilisé tel que chaque événement élé- 
mentaire, toujours au sens de singleton, ait une probabilité égale à 1. Dans l’ensemble 
précédent, la probabilité P est alors définie par P({a}) = 1 et P({b,c}) =0. 

3. Même dans le cas où les événements À et B ne sont pas disjoints, on peut avoir 
l’égalité P(A U B)= P(A) + P(B); il suffit pour cela que P (A NA B)=0. Par 
exemple, définissons sur Q = {a,b,c} la probabilité P par P({a})=P({b})=1/2 
et P ({c})=0. Avec A={a,c} et B={b,c} on obtient P (A)=P (B) = 1/2 et 
P(AU B)=P (Q)=1=1/2+1/2= P (A)+ P (B) et pourtant AN B = {c} £Q. 
Terminons ce paragraphe par deux exemples, paradoxaux à première vue. 


Exemple 1.13 


Dans un tournoi exhibition de tennis, Djokovic doit affronter Nadal et Federer au 
cours de trois sets successifs où ses deux adversaires alterneront. Il remportera ce 
tournoi s’il gagne deux sets consécutifs. Il considère que la probabilité p de battre 
Federer est supérieure à celle g de battre Nadal : p > q. Quel adversaire va-t-il choisir 
d’affronter en premier ? 


Pour une succession Fed-Nadal-Fed, sa probabilité de gain est : 
Pi = pq +(l— p)qp. 
Pour une succession Nadal-Fed-Nadal, cette probabilité est : 
Pa=4p+(—g)pq = p; +pqa(p—4)> pi. 


Il doit donc choisir d’affronter le joueur le plus fort en premier, ce paradoxe s’expli- 
quant par le fait qu’il a plus de chances de le battre une fois sur deux parties que sur 
une seule. 


Exemple 1.14 


Déterminons la répartition la plus probable de six atouts entre deux partenaires de 
2 
bridge. Il y a ( t répartitions possibles des 26 cartes des deux joueurs. Les dé- 


nombrements des répartitions de six atouts, et donc des vingt non-atouts, entre les 
deux joueurs sont indiquées dans le tableau ciaprès : 


(1,5) (2, 4) (3,3) (0,6) 
6, ,20 20 


2(1) (12) | 202) (1) | 2(3) (11) | 2(13) 


ce qui correspond aux probabilités : 


_ 117 _ 390 _ 286 os 


C’est donc la répartition (2, 4) qui est la plus probable. 
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On demande maintenant de répondre à la même question dans le cas où les deux par- 
tenaires ont fourni aux deux premiers tours d’atout. Les seules répartitions initiales 
possibles sont alors (2, 4) et (3, 3), donnant respectivement les répartitions (0, 2) et 


22 
(1, 1) après deux tours d’atout. Il reste ( I à répartitions équiprobables entre les 


deux joueurs, les répartitions restantes des deux atouts, et donc des vingt non-atouts, 
ayant comme probabilités : 
20 2\20 
(1) 10 Go) : 11 


P{(0,2)} = 7e PAROI 


22) 
Éi) 21 
La répartition la plus probable a posteriori, c’est-à-dire après les deux tours d’atouts, 
est donc issue de la moins probable des deux a priori. 


) Probabilités conditionnelles 


On considère l’espace probabilisé (Q, À, P) et un événement particulier B de À tel que 
P(B) > 0. La connaissance de la réalisation de B modifie la probabilité de réalisation 
d’un événement élémentaire, puisque l’ensemble des résultats possibles est devenu B 
et non plus Q. 


Exemple 1.15 


À l'issue d’un jet de dé, on sait que le résultat est supérieur à trois et on s'intéresse à 
l’événement À = « obtenir une face paire ». Initialement on avait P(A) = 3/6 = 1/2; 
maintenant Q est devenu Q]B = {4,5,6} et P(A|B) = 2/3 > 1/2. 


Cette nouvelle probabilité, notée P(.|B), est définie sur la tribu conditionnelle : 
A|B={ANB/AE A} 
par : 
P(A N B) 
P(B) 
Seuls les événements ayant une partie commune avec B peuvent se réaliser et la 


figure 1.1 visualise cette situation où l’ensemble fondamental est devenu B et donc 
seule la part de À incluse dans B est prise en compte dans le calcul de la probabilité 


P(A]B) = 


conditionnelle. 

Vérifions que cette application x de À dans R, définie par z(A) = P(ANB)/P(B)est 
bien une probabilité. On a bien entendu z(A) > 0 et comme AN B C B on a également 
z(A) < 1. D'autre part : 

P(Q n B) 2 P(B) =. 

P(B) P(B) 

donc x vérifie la première condition de la définition. 


z(Q) — 
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Figure 1.1 


Enfin, si À, € À avec À,, N À, = Ÿ pour m £ n, alors: 


co 1 co co P(A, n B) co 
A, l=—=-P4l 4 NB = 2 x(A,) 
L (Ü ) P(B) {Ü d } D P(B) D d 


donc la condition 2 est aussi vérifiée. 


Exemple 1.16 


On tire sans remise deux cartes successivement d’un jeu de 52 et on cherche la pro- 
babilité de tirer un as au deuxième coup sachant que l’on en a obtenu un au premier. 


Avec des notations évidentes : 
P(A, A) : (4 x 3)/(52 x 51) + - Ï 


PA) 4/52 Si. 17 
alors que la probabilité non conditionnelle est : 
4x3 , 48x84 4 Da 1 
52X51 52X51 52 13 
donc valeur plus élevée (avoir tiré un as au premier coup diminue la probabilité d’en 


P(4; |A) = 


P(A;) = P(A,A;) + P(A,A;) = 


tirer un au second). 


Exemple 1.17 
On lance trois fois une pièce de monnaie et on considère les événements À = «obtenir 
au moins deux face » et B = « obtenir face au premier coup ». L'ensemble fonda- 
mental retenu est Q = { P, F}°, ensemble des triplets ordonnés, bien que l’ordre des 
résultats n’intervienne pas, mais pour qu’il y ait équiprobabilité des événements élé- 
mentaires, soit P({æ}) = 1/8 puisque card Q = 2° = 8. Ces événements s’écrivent 
A={FFP,FPF,PFF,FFF}eB={FFF,FFP,FPF,FPP},avec card A = 
card B = 4 donc P(A) = P(B) = 4/8 = 1/2. Calculons maintenant la probabilité 
conditionnelle P(A|B). Ona ANnB={FFP,FPF,FFF} donc card A NB =3 
et P(AN B) = 3/8. Ainsi : 
P(ANB) 
P(B) 
la probabilité conditionnelle a ici augmenté. 
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La formule de définition de la probabilité conditionnelle peut aussi s’écrire, si 
P(A) > 0: 


P(An B) = P(B)P(A|B) = P(A)P(B|A) 


et s’appelle parfois formule des probabilités composées ; elle se généralise par 
récurrence : 
P(A,;n4,n...n4,)= P(A,)P(4,[1A,)P(4;]A, Nn A;) 
… P(A,IA; NA, nn... NA) 


n k-1 
= P(A)[[? (au N 1) 
k=2 i=] 


Exemple 1.18 

Dans une urne qui contient deux boules rouges et trois noires, quatre personnes tirent 
successivement une boule sans la remettre ; la première qui tire une rouge gagne. 
Calculons la probabilité de gain de chaque personne À, B, C et D: 


 P(A)= P(Rj) = À 


5 
: 2 3 
À P(B)= PANDP(RIN)==Xx<=— 
(B)= P(NDP(RIND= EXT = 
Ë 3-5 à À 
i P(C)= P(N,)P(N;| N)PCRa] NN) = 4, 
: à 2 1.2.1 
E P(D)= P(NDPON] NDPCN3] MIND PCR] MINND = EX EX EXS ES 


Théorème de Bayes 


Nous allons voir à partir d’un exemple dans quelles conditions on peut être amené à 
utiliser la formule, ou théorème, de Bayes. 


Exemple 1.19 

Considérons une expérience aléatoire qui se déroule en deux étapes : on tire au sort 
entre deux urnes U, et U,, avec des probabilités respectives de 1/5 et 4/5, puis on 
tire une boule dans l’urne choisie. Leurs compositions respectives sont 6 blanches, 
4 noires et 3 blanches, 7 noires. La probabilité a priori de U, est donc 1/5. Sa proba- 
bilité a posteriori, sachant qu’on a obtenu une boule blanche, va être plus élevée car 
la probabilité de tirer une blanche dans U, est plus forte que dans U,.. 

On a: 

P(U, nB) 


P(U;1B)= PB) 
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avec : 
PU, n B) = P(U,)P(B|U,) = À x © = à 
- | VS" 10 25 
P(B) = P(BNU,)+ P(BNU,) 
= P(U;)P(BI|U,) + P(U,)P(B|U,) 
SUN RIRE 
5° 10 5 10 25 
ainsi : 
3/25 1 1 
P B = = — P = — 
(U;1B) 9/25 Se (U:;) 5 


Cet exemple peut se traiter par application de la formule de Bayes que nous allons 
établir en considérant un système complet d’événements, c’est-à-dire une partition de 
Q en événements {A,,...,A,} de probabilités strictement positives, P(A;) > 0 pour 
1 < i < n, et incompatibles deux à deux, i.e. avec À, n A; = ÿ pour i £ jet 
1 P(A)) = 1. On suppose que les probabilités des événements inclus dans chacun des 
À, sont connues et on va donc décomposer un événement quelconque B sur ce système : 


p=00=80((Ja)-Uunn 


i=1 


i=] 


On aboutit ainsi à la formule de la probabilité totale : 


P(B) = > P(A, n B)= D P(A;)P(B |A) 
i=1 i=1 
Ceci va nous permettre de calculer les probabilités a posteriori P(A;|B), après réalisa- 
tion d’un événement B, à partir des probabilités a priori P(A;),1 <i<n: 
P(A, n B P(A;)P(B |A; 
PQ 18) = PA: 8) _ _PADP(B|AN 
P(B) Le 
P(A;)P(B]4;) 
j=1 


J= 


résultat appelé formule de Bayes ou parfois théorème de Bayes. 


Exemple 1.20 

On tire au sort entre trois urnes dont les compositions sont indiquées dans le tableau 
ci-après. Sachant qu’on a obtenu une boule rouge, on se pose la question de savoir 
quelle est la probabilité qu’elle provienne de l’urne U.. 


Rouge | Bleue | Verte 
U 3 4 1 
U» 1 2 3 
Uz 4 3 2 
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3 3 


1/3 1 4 
PCR) = À PCR NU) = X PUDP(RIU) = 3 (2+e+<) 
i=1 i=1 

La probabilite a posteriori de l’urne U, étant donc : 

P(U;)P(R |U 176 

P(U, |R) = P(U)P(RIU,) L Ê 
PCR) 3/8+1/6+4/9 
12 36 71 
= — = — RE — P 
71 213 213 U) 


@ Indépendance en probabilité 


DÉFINITION 
Deux événements À et B sont dits indépendants, relativement à la probabilité P, 
si : 


P(A n B) = P(A)P(B) 


La probabilité de réalisation simultanée de deux événements indépendants est égale 

au produit des probabilités que chacun de ces événements se produise séparément. En 

conséquence, si P(B) > 0: 

P(A Nn B) _ P(A)P(B) 
P(B)  P(B) 

la réalisation d’un événement ne modifie pas la probabilité de réalisation de l’autre. 


P(A|B) = = P(4) 


ATTENTION ! 
Ne pas confondre indépendance avec incompatibilité, car dans ce dernier cas 
AnB=f#etP(AnB)=0. 


Exemple 1.21 


On jette un dé rouge et un dé vert et on considère les événements À = «le dé vert 
marque 6 », et B = «le dé rouge marque 5 ». Il nous faut démontrer que ces deux 
événements sont indépendants (bien entendu ce résultat est évident, il n’y a pas d’in- 
fluence d’un dé sur l’autre !). L’ensemble fondamental retenu est Q = E X E, avec 
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E = {1,2,3,4,5,6}, sur lequel il y a équiprobabilité : P({w}) = 1/62. Comme 
A={6}XE,B=EXx{5}et An B = 7{(6,5)} on obtient : 


card À 6 1 

FE cardQ 6 6 

card B 6 1 

RE cardQ 6 6 
P(A n B)= card (A N B) _1 = P(A)P(B) 


cardQ 6? 
et les événements À et B sont donc bien indépendants. 


Indépendance mutuelle 


Si l’on considère n événements À,, avec n > 2, il y a lieu de distinguer l’indépendance 
deux à deux qui impose : 


P(A;NA)=P(A)P(A), 1<ifji<n 


de l’indépendance mutuelle, condition plus forte qui s’écrit : 


P(A; N A, Ne N A,)= P(A;)P(A,). PA) 2<KkK<n, 


pour tous les sous-ensembles {i,,...,i,} de {1,2,...,n}, ce qui correspond à : 


É(D-r-()-()-r-r- 


conditions qui doivent être réalisées. 


Exemple 1.22 

On lance deux pièces de monnaie distinctes et on s’intéresse aux événements 
A = «obtenir pile sur la pièce 1», B — «obtenir pile sur la pièce 2 » et 
C = «obtenir pile sur une seule pièce ». À chaque pièce est attaché le même en- 
semble fondamental E = {P, F} et à l’expérience l’ensemble Q = E x E. On peut 
écrire A ={P}xE = {PP,PF} donc P(A)=2/4,B=EX{P}={PP,FP} 
donc P (B) = 2/4et C = {PF,FP} donc P (C) = 2/4. On considère main- 
tenant les événements deux à deux : À N B = {PP} donc P (AN B) = 1/4 = 
P(A)P(B), ANC = {PF} donc P(ANC)=1/4= P(A)P(ChetBnC={FP} 
donc P(BNC) = 1/4 = P(B)P (C), ces événements sont indépendants deux à 
deux. Mais AN BNC =f$ÿdonc P(ANBNC)=0 £ P (A)P (B)P (C)et ces 
événements ne sont pas indépendants dans leur ensemble. 
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© Pour aller plus loin : 
éléments de combinatoire 


Dans le cas particulier où il y a équiprobabilité sur un ensemble fini d'événements 
élémentaires, nous avons vu (cf. 1.3) que le calcul d’une probabilité se ramenait à un 
problème de dénombrement. Ce type de problèmes est parfois très complexe et nécessite 
de connaître quelques éléments de combinatoire, permettant d'exprimer par une formule 
le nombre de configurations ayant des propriétés données. Examinons les configurations 
usuelles. 


5.1 Permutations avec répétition 
Une permutation avec répétition de r objets pris parmi n est une suite ordonnée de r 


éléments choisis parmi n, et pouvant se répéter. 


Exemple 1.23 
Un mot de six lettres est une permutation avec répétition de six objets choisis parmi 
un ensemble, l’alphabet, de 26 éléments : coucou, habile, garage. 
Lhy al bi Li] Li Le] 
il 2 3 4 5 6 


E(r) F(n) 


Une telle permutation peut être représentée par les r objets rangés dans des cases 
numérotées de 1 à r. Pour chacune de ces r cases, il y a n choix possibles de l’objet 
à ranger, donc le nombre total de ces permutations est : 


P'=n 


n 


Exemple 1.24 


Le nombre de mots possibles de trois lettres est 26° = 17 576. 


Cela correspond au cardinal de l’ensemble fondamental associé à r tirages avec re- 
mise (schéma binômial) dans une urne contenant n objets distincts (ou éventuellement 
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considérés comme tels de façon justement à obtenir des événements équiprobables) et 
tenant compte de l’ordre des tirages. 

C’est aussi le nombre d’applications quelconques d’un ensemble E à r éléments dans 
un ensemble F à n éléments, une application quelconque pouvant être définie comme un 
rangement de r objets dans n boîtes, chaque boîte pouvant contenir zéro, un ou plusieurs 
objets. 


5.2 Permutations sans répétition ou arrangements 


Une permutation sans répétition, ou arrangement, de r objets pris parmi n est une 
suite ordonnée de r éléments choisis parmi n, et qui ne peuvent pas se répéter. 


Exemple 1.25 


Le quinté est un exemple d’arrangement de cinq chevaux pris parmi tous les partants 
de la course. 


Une telle permutation peut être représentée par les r objets rangés dans des cases 
numérotées de 1 à r. Pour la première case, il y a n choix possibles, pour la deuxième 
il n’y en a plus que n — 1, et pour la r-ème il n’en reste plus que n — r + 1 ; le nombre 
d’arrangements est donc : 

n! 


Cela correspond au cardinal de l’ensemble fondamental associé à r tirages sans re- 


A =n(n-1l)..(n-r+1)= 


mise (schéma hypergéométrique) dans une urne contenant n objets distincts et tenant 
compte de l’ordre des tirages. 

C’est aussi le nombre d’applications injectives d’un ensemble E à r éléments dans 
un ensemble F à n éléments, une application injective pouvant être définie comme un 
rangement de r objets dans n boîtes, chaque boîte ne pouvant contenir que zéro ou un 
objet. Il faut bien sûr que n = card F > cardE =r. 


Exemple 1.26 


Le nombre de tiercés dans l’ordre avec quinze partants est : 


Aï, = 15 x 14x 13 = 2730 


Permutation : il s’agit du cas particulier n = r. 
Une permutation est donc une suite ordonnée de n objets distincts ; le nombre de 
permutations est : 
P,=A"=n! 


n n 


Exemple 1.27 


Le classement de cinq candidats à une épreuve forme une permutation, il y en a 
5!=120. 
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C’est aussi le nombre de bijections d’un ensemble E à n éléments dans un ensemble 
F à n éléments. 


5.3 Permutations avec répétition de n objets, 
dont k seulement sont distincts 


Il s’agit d’une suite ordonnée de n objets choisis dans k classes distinctes, le nombre 
d’objets de la classe i étant n,, 1 < i < k, avec bien sûr n, +... +n, = n. Prenons 
l'exemple de n boules numérotées, extraites sans remise d’une urne, et de k couleurs 
distinctes. Il y a n! tirages ordonnés possibles ; mais si on efface les numéros des n, 
boules rouges par exemple, les n,! permutations de ces boules conduisent à la même per- 
mutation, donc le nombre de permutations distinctes devient n!/n,! Il en est bien sûr de 
même pour toutes les autres couleurs et par conséquent le nombre de permutations est : 


n! 


Exemple 1.28 
Cherchons le nombre de mots différents formés avec les lettres du mot barbare. Il y 
a sept lettres, mais seulement quatre catégories distinctes, soit un nombre de mots 
distincts égal à : 

7! 


zoo — 090 


C’est aussi le nombre de partitions de n objets en k classes d’effectifs n,,1 <i< Kk, 
fixés. Dans le cas particulier où il n’y a que deux classes, on obtient le coefficient bi- 
NA n ; : ne ; 
nômial qui représente le nombre de sous-ensembles à n, éléments que l’on peut 
n 


1 
extraire d’un ensemble à n éléments. 


5.4 Combinaisons (sans répétition) 


Une combinaison est un sous-ensemble non ordonné de r objets choisis dans un 
ensemble qui en contient n. Ces sous-ensembles sont au nombre de : 


n À, n! 
() rt rln-n! 


Le nombre de tiercés dans le désordre avec quinze chevaux au départ est : 


15 
() as 


Exemple 1.29 
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Le sous-ensemble choisi définit bien sûr le sous-ensemble restant et donc : 


Exemple 1.30 


On joue au poker d’as avec quatre dés identiques et on souhaite calculer la probabilité 
des différents résultats possibles. Bien que les dés ne soient pas distincts, nous rete- 
nons comme ensemble fondamental Q = E*, où E = {1,2,3,4, 5,6} est l’ensemble 
des résultats associés à un dé particulier ; ainsi tous les événements élémentaires sont 
équiprobables et ont même probabilité 1/6“. En effet, un résultat est une permutation 
de quatre objets choisis parmi six. Un carré est un résultat de la forme (aaaa) avec 
six choix possibles pour la hauteur : 
LR 
6. 567 
Un brelan est un résultat de la forme (aaab) avec six choix pour la hauteur a, cinq 
choix pour b et quatre places possibles, soit : 
6x5x4 _ 20 

6* 63 


P (carré) = 


P(brelan) = 


Une double paire est un résultat de la forme (aabb) avec () choix possibles pour 


les paires et une permutation de quatre objets dont deux seulement sont distincts, soit 
4! 


—— et: 
212! 
P (double paire) = . 
Une paire est un résultat de la forme (aabc) avec six choix possibles pour la hau- 


teur, c choix possibles pour les hauteurs qui l’accompagnent et un nombre de 


permutations de quatre objets dont trois distincts —# soit : 
21111! 


P (paire) = _ 
Le nombre de résultats quelconques (abcd) est le nombre de permutations sans 
répétition de quatre objets pris parmi six, d’où : 
6X5xX4X3 _ 60 


P (quelconque) = & D 


On vérifie bien que la somme des probabilités est égale à Te = ]. 


Tous les sous-ensembles que l’on peut extraire d’un ensemble E à n éléments peuvent 


contenir O, 1, , n éléments, d’où la relation : 


card P(E) = 2" = (i) “. () He o 
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Enfin, parmi les sous-ensembles à r éléments, il y a ceux qui contiennent un objet 


cnrs n ; : n—l 
particulier, en nombre 1 et ceux qui ne le contiennent pas, en nombre 


À 
d’où la relation : 


qui permet de construire le triangle de Pascal. 


5.5 Combinaisons avec répétition 


Une combinaison avec répétition est un sous-ensemble non ordonné de r objets choisis 
dans un ensemble qui en contient n et qui peuvent se répéter. 


Exemple 1.31 

Les r objets tirés avec remise dans une urne qui en contient n distincts forment 
une combinaison avec répétition puisque seule compte la nature des objets tirés, 
indépendamment de l’ordre des tirages. 


Une telle combinaison sera représentée sous la forme (x,,...,x,)où x,1<i<n 
représentera le nombre d’objets i appartenant au sous-ensemble, avec bien sûr x, > 0 
etx, +..+x, = r. Elle peut être symbolisée par une suite formée d’objets © et de 
séparateurs / avec x, objets © avant le premier séparateur, x, objets entre le premier et 
le deuxième /..., x, objets O après le (n — 1)-ème /. Elle est donc caractérisée par la 
place des r objets © dans la suite des r + n — 1 symboles. 


1 2 3 n-2 n-1 
o0/000// Free loloo 
4 br Pa . 


Par exemple, la combinaison constituée de deux objets de la catégorie 1, d’un objet 
de la catégorie 3 et de trois objets de la catégorie 4 s’écrit (2,0, 1,3)ou2+0+1+3 = 6 
représentée sous la forme symbolique : O © // O/ © O ©. Réciproquement, la suite 
de symboles / © / O © ©O/O O représente une combinaison d’un objet de la caté- 
gorie 2, de trois objets de la catégorie 3 et de deux objets de la catégorie 4. Il y a donc 
une bijection entre une combinaison et une telle suite, et le nombre de combinaisons 
avec répétition est donc égal au nombre de rangements des r objets © (ou des n — 1 
séparateurs /) dans les r + n — 1 cases, soit : 


c'= sn 
" r 
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5.6 Partitions 


Le nombre de partitions de n objets en r classes d’effectifs non fixés est appelé nombre 
de Stirling de deuxième espèce et se calcule à partir de la récurrence : 


Sr = St +rS, 1<r<n 


n 


avec bien sûr S1 = 1 et S? = 2"-1 - 1, Les partitions de n + 1 objets en r classes se 
décomposent en effet en celles où le (n + 1)-ème objet constitue une classe à lui tout 
seul, il y en a S’7}, et celles où on l’intègre à une classe déjà formée, il y en a rS". 

Une surjection d’un ensemble E à n éléments dans un ensemble F à r éléments cor- 
respond à un rangement de n objets dans r boîtes dont aucune n’est vide, c’est-à-dire à 
une partition de ces n objets en r classes, où l’ordre des classes intervient. À une parti- 
tion donnée correspondent r! surjections distinctes, donc le nombre total de surjections 
est rlS. 

Le nombre de partitions de n objets distincts en k classes dont n; ont le même effectif 
j,1<j < k, (avec bien sûr >. jn; = n) est: 


n! 
(A2)... KD'En,!...n,! 
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L'essentiel @ 


@ Le modèle associé à une expérience aléatoire est arbitraire et doit être 
choisi le plus simple possible, compte tenu du problème à résoudre. 
Il est très souvent souhaitable de retenir un ensemble fondamental tel 
que les événements élémentaires soient équiprobables, même si dans 
la réalité on ne peut pas les distinguer, car le calcul des probabilités est  : 
alors ramené à un problème de dénombrement. 


@ Une probabilité est une application et non pas un nombre. Il faut 
toujours vérifier que la somme des probabilités des événements élé- 
mentaires est égale à un et, dans le cas d'un nombre fini d'événements, 
ne pas calculer la probabilité du dernier en retranchant à un la proba- 
bilité de tous les autres, car cela exclut cette vérification permettant de 
déceler éventuellement une erreur dans le calcul de ces probabilités. É 


@ L'indépendance de deux événements est définie relativement à une 
probabilité. L'indépendance mutuelle d'un nombre quelconque d'évé- 
nements est une condition plus forte que l'indépendance de ces 
événements pris seulement deux à deux. 


O La notion d'indépendance est à distinguer de celle de non-causalité,  : 
la condition P(AIBn C) = P(AIB) se traduisant par « C ne cause pas A».  : 
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(@) Entrainez-vous 


1.1 


1.2 


1.3 


1.4 


1.5 


1.6 


1.7 


Une machine fabrique des objets qui sont classés en défectueux, codés 0, et non défec- 
tueux, codés 1. On prélève toutes les heures les trois derniers objets produits par cette 
machine. On demande de préciser l’ensemble fondamental associé à cette expérience 
et d’écrire les événements suivants : À = « le premier objet est défectueux » ; B = «le 
dernier objet est non défectueux » ; C = «les premier et dernier objets sont défec- 
tueux » ; D = « aucun objet n’est défectueux » ; E = « deux objets sont défectueux » ; 
F = «au plus un objet est défectueux ». 


Soit Q@ —= {a,b,c} et considérons les ensembles À, = {ÿ,{a},{b,c},Q} et 
À ={8, {b},{a,c},Q}. Montrer que ce sont des tribus sur ©. Les ensembles À, Nn A; 
et À; U À, sont-ils des tribus sur @ ? 


Soit Q = N et À la famille des parties À de Q, telles que À est fini ou bien A est 
fini. Montrer que À est une algèbre mais pas une o-algèbre. On pourra considérer les 
ensembles À, = {2n},n EN. 


On effectue deux tirages successifs dans une urne qui contient une boule blanche et 
deux boules noires identiques. La première boule tirée n’est pas remise dans l’urne, 
mais est remplacée par une boule de l’autre couleur (blanche si on a tiré une noire et 
vice-versa). 


1. Construire l’ensemble fondamental Q associé à cette expérience aléatoire, en tenant 
compte de l’ordre des tirages. 


2. Montrer que l’ensemble des parties de Q défini par : 
A = {Bi {(NN)},{(BN),(NB)},Q} 


est une tribu. La notation (BN) représente par exemple l’événement élémentaire «tirer 
une boule blanche, puis une noire ». 


3. Déterminer la probabilité de chacun des événements élémentaires constituant (2. 


On lance un dé quatre fois de suite et le joueur À marque 1 point si le chiffre obtenu est 
1 ou 2; sinon c’est le joueur B qui marque un point. Le joueur qui gagne la partie est 
celui qui a le plus de points à l’issue de ces quatre lancers. Calculer la probabilité de 
gain de chaque joueur, en précisant l’ensemble fondamental Q retenu pour modéliser 
ce problème. 


Une urne contient une boule blanche et une boule noire. On effectue des tirages avec 
remise dans cette urne jusqu’à obtenir une boule blanche, ajoutant une boule noire après 
chaque tirage d’une boule noire. Calculer la probabilité d’effectuer n tirages, n € N*. 


Un laboratoire a mis au point un alcootest dont les propriétés sont décrites ci-après : 
— il se révèle positif pour quelqu'un qui n’est pas en état d’ébriété dans 2 % des cas; 
— il se révèle positif pour quelqu’un qui est en état d’ébriété dans 96 % des cas. 

Dans un département donné, on sait que 3 % des conducteurs sont en état d’ébriété. 
Si le contrôle se révèle positif, quelle est la probabilité que ce conducteur ne soit pas 
malgré tout en état d’ébriété ? 
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1.8 


1.9 


1.10 


1.11 


1.12 


1.13 


1.14 


1.15 


Notion de probabilité 


Le professeur Tournesol cherche ses gants qu’il pense avoir rangés avec une probabilité 
p dans sa commode. Si c’est le cas, il les a mis au hasard dans l’un des 4 tiroirs. Sachant 
qu’il ne les a pas trouvés dans les 3 premiers, calculer la probabilité qu’ils soient dans 
le quatrième. 


On effectue deux tirages successifs avec remise dans une première urne qui contient 
autant de boules noires que de boules blanches. On place ensuite dans une seconde 
urne vide deux boules de la même couleur que celles qui ont été tirées. 

1. Indiquer les différentes compositions possibles de cette urne et la probabilité 
associée. 

2. On effectue ensuite des tirages successifs avec remise dans cette seconde urne. On 
note p, la probabilité que cette urne contienne deux boules blanches, sachant que l’on 
n’a obtenu que des boules blanches au cours des ñn premiers tirages. Calculer p;, p,, puis 
P, pour n > 2 et ensuite la limite de p, quand n devient infini. Cette limite était-elle 
prévisible ? 

On jette ensemble cinq dés identiques et à chaque coup on enlève les as (chiffre 1) qui 
sont sortis avant de relancer les autres dés. Quelle est la probabilité d’obtenir un poker 
d’as, c’est-à-dire cinq as, en trois coups au plus ? 

Un document contient quatre erreurs et à chaque relecture la probabilité de détection 
d’une erreur ayant subsisté est de 1/3. Quelle est la probabilité p, qu’il ne subsiste 
aucune faute après n relectures, n € N* ? 


Un étudiant doit répondre à un questionnaire à choix multiple où cinq réponses sont pro- 
posées à une question, une seule étant correcte. Quand l’événement À = « l’ étudiant a 
bien travaillé dans l’année » est réalisé, la réponse est fournie avec exactitude. Dans le 
cas contraire, l’étudiant répond au hasard. Si l’événement B = «il a fourni la réponse 
correcte » est réalisé, calculer la probabilité P (A |B) en fonction de p = P(A). 


Dans la rue principale de Champignac, chacun des deux feux de circulation successifs 
est vert les deux tiers du temps. Si vous roulez à la vitesse réglementaire de 50 km/h, 
après avoir franchi le premier feu au vert, vous trouverez le second au vert trois fois 
sur quatre. Si vous grillez le premier feu au rouge, calculez la probabilité que le second 
soit aussi au rouge si vous roulez toujours à la vitesse réglementaire de 50 km/h, en 
précisant l’ensemble fondamental retenu pour ce problème. 


Deux joueurs de tennis s’entrafnent au service, le joueur À servant une fois sur trois et le 
joueur B deux fois sur trois. Leurs pourcentages de réussite au service sont respective- 
ment de 90 % et de 60 %. 

1. Si vous assistez à un service réussi au cours de cet entraînement, quelle est la 
probabilité p}3 qu’il s’agisse du joueur B ? 

2. Calculer cette probabilité p, en fonction du pourcentage p de réussite du joueur B. 
Pour quelle valeur de p} cette probabilité est-elle égale à 1/2? 

3. Que vaut p} dans le cas où les joueurs À et B ont le même pourcentage de réussite 
au service ? Le résultat était-il prévisible ? 


Soit Q = {a, b, c, d} avec équiprobabilité des événements élémentaires sur P (Q). Les 
événements À = {a,b}, B = {a,c} et C = {a,d} sont-ils indépendants ? 
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1.16 


1.17 


1.18 


1.19 


Les événements À et B étant indépendants, montrer que les événements À et B ainsi 
que À et B sont aussi indépendants. Si l’événement C est indépendant de À et de B, 
est-il aussi indépendant de À U B ? L'événement C est-il indépendant de À Nn B? 


On effectue trois lancers successifs d’une pièce de monnaie. Les événements 
A ={FFF,PFF,FPP,PPP},B = {FFP,FPP,PPF,PPP}etC = {FFP, 
FPF,PFP, PPP} sont-ils indépendants ? 


Problème de rencontres. Lors d’un bal auquel participent n couples, le choix de sa 
cavalière pour la première danse se fait au hasard. La probabilité de danser avec sa 
femme est donc 1/n, valeur faible si n est grand. Cependant, on demande de montrer 
que la probabilité qu’il y ait au moins une rencontre entre un danseur et sa femme est 
supérieure à la probabilité qu’il n’y en ait pas. 

Avant le tirage au sort des quarts de finale de la Ligue des Champions de football, il 
reste 4 équipes anglaises. Calculer la probabilité p qu’il y ait au moins un quart de finale 
qui oppose 2 équipes anglaises. 


®@": 
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1.2 


1.3 


1.4 


1.5 


Solutions © 


On choisit comme ensemble fondamental Q = {0, 1}°, c’est-à-dire l’ensemble des 
triplets ordonnés, bien que l’ordre soit sans importance, car cela permet d’obte- 
nir des événements élémentaires équiprobables et facilite donc le calcul ultérieur 
des probabilités. Les événements indiqués s’écrivent alors : À = {0} x {0,1}?, 
B=1{0,1}?x{1}, C=1{0}x {0,1} x {0} = {(000),(010)}, D ={(111)}, 
E = {(001), (010), (100)}, F = {(111),(110),(101),(011)}. 


Si on note A, ={a} et A, = {b}, les deux ensembles considérés s’écrivent 
À; = {9,4,4,0}, avec i = 1,2, et sont donc des tribus sur Q. L'ensemble 


Ain A = {9,Q} est la tribu grossière et A; U A, = {ÿ,{a},{b},{a,c}{b,c},Q} 
n’est pas une tribu car {a,c}N{b,c} = {c} # A; U A; . 


La famille À est non vide puisqu’elle contient par exemple les ensembles A, Par défi- 
nition, elle est fermée pour le passage au complémentaire. Si deux éléments À et B de 
la famille sont finis alors À U B l’est aussi ; si l’un des deux n’est pas fini alors À U B 
n’est pas fini mais son complémentaire l’est, comme intersection de deux ensembles 
dont l’un est fini. Ainsi dans les deux cas À U B appartient à À qui est aussi fermée 
pour l’union donc est une algèbre. 

Mais l’union dénombrable U, £ NA, = 2 N est l’ ensemble des entiers pairs qui n’est 
pas fini. Son complémentaire est l’ensemble des entiers impairs, qui n’est pas fini non 
plus, et donc cet ensemble n’appartient pas à la famille A. Il n’y a pas fermeture pour 
l’union dénombrable donc cette algèbre n’est pas une o-algèbre. 


1. L'ensemble fondamental est constitué de tous les événements élémentaires possibles, 
écrits sous la forme de couples dont la première lettre désigne la couleur de la première 
boule tirée et la seconde la couleur de la boule extraite ensuite. Si la première boule 
tirée est blanche, l’urne ne contient plus que des boules noires et le seul événement 
possible est donc représenté par le couple ordonné (BN). Si la première boule tirée est 
noire, la composition de l’urne est { B, B, N } et il y a alors deux événements possibles, 
(NB) et (NN). On a donc : 


Q = {(BN), (NB), (NN)} 


2. L’ensemble A est un ensemble non vide de parties de Q qui peut s’écrire 
A = {5 A, À, a} en ayant posé À = (NN). Il est facile de voir qu’il est fermé pour 
l’union et le passage au complémentaire, donc est une algèbre. Comme A comporte un 
nombre fini d'éléments, cette algèbre est aussi une o-algèbre, ou tribu. 

3. D’après la question 1 : 


_- 
3 


2 21 
= P(NN)=-=x- 
3 ( ) 3 3 
Si on note À l’événement « le joueur À a marqué un point », l’ensemble fondamental 


est : 


P(BN)= 3 XI P(NB)= 
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1.7 
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Il n’y a pas équiprobabilité ici car P (A) = : et P (4) = ; . Pour que le joueur À 


gagne, il faut qu’il marque 3 ou 4 points et il en est de même pour le joueur B. Les 
probabilités de gain de chaque joueur sont donc : 


P«a@=4(1)24(1) =! 


3/ 3713 9 
Pao=4(5) 3+(5) -$ 


La somme de ces probabilités n’est pas égale à 1 car les joueurs peuvent marquer 


2 points chacun et être ex-aequo . 
_ _ = — 


Effectuer n tirages correspond à l’événement, noté B,, « obtenir une boule blanche au 
n-ème tirage et des boules noires à tous les tirages précédents ». Nous obtenons ainsi : 


P(EX)= ( 


1 
ECS 

11 
P(B)ESXS 

1 2 n -1 1 1 
RES ea can) 


Nous noterons AŸ* l'événement « l’alcootest est positif» et Æ l’événement 
« le conducteur est en état d’ébriété ». Les hypothèses fournies se traduisent en termes 
de probabilité par : P(A*IE) = 0,02, P(AŸ|E) = 0,96 et P(E) = 0,03. La probabilité 
demandée est : 


P(E|A*) _ P(E Nn A*) . P(E)P(A*|E) 
PGA?) P(E)P(AYIE) + P(E)P(A*|E) 
0,02 x 0,97 


0,02 X 0,97 + 0,96 x 0,03 


ce qui traduit la non-fiabilité de cet alcootest. 


On note C l’événement « les gants sont rangés dans la commode », 4 «ils sont dans 
le tiroir 4 » et 3 «ils ne sont pas dans les 3 premiers tiroirs ». La probabilité cherchée 


s'écrit P (4 3) et se calcule par la formule de Bayes. Comme P (3 c) = 1/4et 
P (3 C) = | on obtient : 


p(an3) P(4) pla p 


PO) 26 ms Tr 
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Notion de probabilité 


1. L'ensemble fondamental associé à ces deux tirages indépendants est Q = { B, N }?. 
Il y a 3 compositions possibles de cette urne avec P(BB)= P(NN)=1/4 et 
P(BN)=2/4. 

2. On utilise la formule de Bayes pour calculer p, = P(BBIB;), avec P(B,|BB) = 1, 
P(B.INN) = 0 et P(B;1 NB) = 1/2; ainsi p, = 1/2. On obtient de la même façon 
P2 = 2/3 puis pour n > 2: 

L P(BB) ”. 1 

| P(BB)+P(B;..B,|BN)/2 1+1/2"1 

Quand n devient infini p, — 1, résultat prévisible car si on ne tire que des boules 
blanches, c’est sans doute qu’il n’y a pas de boule d’une autre couleur dans l’urne. 


Pa 


Soit N,, 1 < i < 5 le nombre de jets nécessaires pour obtenir un as avec le dé i. 
Le poker d’as est obtenu en moins de trois coups si max {N;/1 < i < 5} < 3, 
événement qui est équivalent à : 


NN: <3} 


f=\ 


Tous ces événements sont indépendants et ont la même probabilité : 


re grneoeS (Le) 


La probabilité demandée est donc : 


(5) -00 


Pour qu’une faute ne soit pas corrigée il faut qu’elle ait subsisté à chaque relecture, 
ce qui se produit avec une probabilité (2/3)" ; pour chaque faute la probabilité d’être 
corrigée est donc 1 — (2/3) et la probabilité de correction des quatre erreurs est par 
conséquent : 


Bien sûr p, tend vers un quand n devient infini, avec p, = 0,41 ; p = 0,69 ; pg = 0,85 
et P1o = 0,93. 


Il suffit d’appliquer la formule de Bayes : 

P(ANB) _ P(A) P(B]|A) : p __ Sp 
P(B) P(A)P(B|A)+ P(A)P(B|A) Up+(i-p)/5 A4p+l 

On peut noter que P(A|B) > P(A) = p, avec bien sûr P (AI B) = 0 sip = 0 et 

P (AI B) = 1 si p = 1. Dans tous les autres cas P (AI B) > P (A). 


L'ensemble fondamental est constitué des couples ordonnés dont les éléments symboli- 
sent la couleur des premier et second feux : 


Q = {VV Vi R;, R;W;, RiR;} 


P (A|B) = 
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Nous noterons : 
n=P(VMW);p=P(VR):p;=P(RiV);:p4= P(RIR) 
Les hypothèses se traduisent par : 
P(V)=p;+p2= P(V) = p1+p3=2/3 
P(V|V) =3/4 
On en déduit : 
1 
n=P(mV)=P(m)P(V|H)= : 


puis p = p3 = 1/6 et donc p4 = 1/6. 
On peut alors calculer : 


P(R|R)=————=; 


1.14 1.Si on note R l'événement « réussir son service », on obtient : 
P(BNR 2X 0,6 
Pr FO FR = 0,9+2X0,6 : 
2. On obtient cette fois : 
2p 
PET Gros 
avec pg = 1/2 pour p = 0,45. 


3. Si les joueurs ont le même taux de réussite : 


1.15 En raison de l’équiprobabilité : 
P(4)= P(B)=P(C)=1/2et P(ANB)= P({a})=1/4= P(A)P(B). 
P(ANC)= P({a})=1/4= P(A)P(C)et P(BNC)= P({a})= 1/4= P(B)P(C) 
donc les événements À, B et C sont indépendants deux à deux. Par contre : 
P(ANBNC)= P({a}) = 3 £ P(A) P(B) P(C) 
et ils ne sont pas mutuellement indépendants. 
1.16 On obtient : 
P(ANB)= P(A)— P(AN B)= P(A) — P(A)P(B) 
= P(A)[1 — P(B)] = P(A)P(B) 
donc les événements À et B sont indépendants. De même : 
P(ANB)= P(B)- P(AN B)= P(B) — P(A)P(B) 
= P(B)[1 — P(A) = P(A)P(B) 


donc À et B sont aussi indépendants. 
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On peut écrire : 


P{(AUB)NC)=P(ANC)+P(AnBncC) 
= P(ANC)+P(BNnC)-P(ANBNC) 
=[P(A)+ P(B]P(C)-P(ANBNC) 
= P(AU B)P(C)+ P(ANB)P(C)- P(ANBNC) 


donc pour qu’il y ait indépendance de C avec À U B il faudrait que P(A)P(B)P(C) = 
P(AN BNC), c’est-à-dire que À, B et C soient mutuellement indépendants, ce qui 
n’est pas le cas en général. Dans l’exercice précédent on a d’ailleurs P(A U B) = 
P({a, b,c}) = 3/4 avec P{(AU B)nC} = P({a}) = 1/4 £ P(AU B)P(C) =3/8 ce 
qui montre que À U B n’est pas indépendant de C. De même, d’après ce qui précède, 
pour que C soit indépendant de AN B, il faut que C soit aussi indépendant de À NB, ce 
qui n’est pas le cas en général comme le montre également l’exercice précédent puisque 
P(AN B)= 1/4 et P(C) = 1/2 avec P(AN BNC) =1/4Z£ P(AN B)P(C). 

On obtient P(A Nn B) = P({FPP,PPP}) = 1/4 = P(A)P(B),P(BNC) = 
P({FFP,PPP})= 1/4 = P(B)P(C}et P(ANC) = P({PPP})=1/8 4 P(A)P(C) 
donc ces événements ne sont pas indépendants deux à deux et a fortiori ne sont pas 
mutuellement indépendants, bien qu'ici P(AN BNC) = P({PPP}) = 1/8 = 
P(A)P(B)P(C). 

Notons par À; l’événement « le danseur i se retrouve avec sa femme ». L'événement 
«il y a au moins une rencontre » est donc U”_ Ai. Sa probabilité s’obtient à partir de la 
formule de Poincaré (cf. 1.3) pour n événements : 


n n 
n=r(0a)- Sc >, P(4,n..na,) 
i=1 k=1 1 NPRERS A Lei à PR 


Si chaque danseur est représenté par une case numérotée de 1 à n, l'événement 
Ai, N...NA;, correspond à une permutation où les femmes de ces danseurs sont placées 


dans les cases i,,...,i,. Comme toutes les permutations sont équiprobables : 
n—k)! 
p(ain.na,)= ) 
| k n! 
Par ailleurs, le nombre de sous-ensembles {i,,...,i,} extraits de {1,...,n} est égal à 


Qi donc : 


et : 


k=1 
La probabilité qu’il y n’ait aucune rencontre est donc : 


n 


: = ER QUE : (1 1 : 
QM=1-pa=1- Y - À = — = 0,36788 
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1.19 


On obtient bien des valeurs plus petites que 1/2, sauf g, = 0, 5. Les autres valeurs sont : 


= 3 = 0,333; a = 3 = 0,375; 


11 265 
= —- = 22 = 0,3681 
gs 30 0, 3667 ; d6 720 


Il y a équiprobabilité de tous les quarts de finale qui sont au nombre de : 
8! 
(21)*4! 
car il s’agit du nombre de partitions de 8 équipes distinctes en 4 matchs de même effectif 
2 (cf. 5.6). 
Pour chaque équipe anglaise, le nombre d’associations possibles avec une équipe non 
anglaise est successivement 4, puis 3, puis 2, puis 1. Il y a donc 4 ! = 24 quarts de finale 
qui ne comportent pas de match entre équipes anglaises. On obtient donc : 
p=l-p=1- ne 
k 105 105 
On peut calculer la probabilité des autres événements élémentaires. Deux quarts de 
finale entre équipes anglaises correspondent à 2 partitions de 2 sous-groupes de 4 
(équipes anglaises et non anglaises) en matchs de même effectif 2, soit un nombre de 
possibilités : 
4! 4! 
————— X —— 
C2 : ya 


La probabilité de deux quarts de finale entre équipes anglaises est donc : 


4 4 
Enfin, il y a ( choix de matchs entre 2 équipes anglaises et ( à choix de matchs 


entre 2 équipes non anglaises. Il ne reste ensuite que 2 façons de choisir les 2 autres 
quarts de finale en associant une des 2 équipes anglaises restantes à une des 2 équipes 
non anglaises restantes. Cela correspond au nombre de quarts de finale : 


42) ()=7 


La probabilité d’un seul match entre équipes anglaises est donc : 


2 
PT 05 
On retouve bien p = p; + p2. 


Chapitre 
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Variable aléatoire 


Introduction PPOCESEEEEESTEEEENET TERRES TEEEEEESTEEEENONTEEEEEESTTEEEEESTEEEEESC TERRES EEE EES EST EEEEEETTES . 


Le résultat © d'une épreuve aléatoire va être codé numériquement au moyen d'une ap- 
plication X : Q@ — R. Pour pouvoir calculer la probabilité de ses différentes valeurs 
numériques possibles il faut pouvoir revenir à l'ensemble fondamental de départ où est 
définie une probabilité. On imposera donc une condition à cette application qui sera alors 
dénommée variable aléatoire (v.a., random variable). Cette terminologie est source de 
confusion puisqu'il s'agit bien d'une fonction! 

Pour la facilité de l'exposé, il sera utile de distinguer le cas où X(Q) est dénombrable, la v.a. 
X étant alors dite discrète, de celui où X(Q) est un ensemble non dénombrable de R (gé- 
néralement un intervalle, pouvant être R tout entier, ou une réunion d'intervalles), la v.a. 
étant dite continue. La loi de probabilité d'une v.a. sera définie par les probabilités indivi- 
duelles dans le cas discret et par la densité dans le cas continu. Nous définirons les deux 
caractéristiques numériques principales d'une distribution, l'espérance, caractéristique de 
valeur centrale, et la variance, caractéristique de dispersion. 


d'une variable aléatoire est déterminée  ? ? Fonction de répartition 
par les probabilités des points dans le 


. vu Densité de probabilité 
cas discret, par la densité dans le cas 


Espérance mathématique 


continu. 

H : ; NA Variance 

: qu'une loi est souvent caractérisée 

; : Écart type 
par ses deux premiers moments 4 É 
(l'espérance et la variance). H CPEEEEE EE EEECE EEE EEEEE EE EEEEC EEE EEETE EE EEE LEE EE EEEE ET EEE 


() Variable aléatoire réelle discrète 


1.1 Définition 


On appelle v.a. discrète définie sur (Q, 4) une application X : Q@ — R telle que X(Q) 
est dénombrable (en général X(Q) est fini ou X (Q) € N'ou X (Q) C Z et dans tous les 


ca 


ce 


s X(Q) est en correspondance bijective avec N) et telle que pour tout x réel : 
X-l(x)={HEQ/X(w)=x}E A 


qui exprime tout simplement que X-!(x) est un événement. 


je" Objectifs CEDEPOEPDEOECEELEELEEDECDECEECEEEEENENS ., PA Concepts clés | nossossssssessessssssse, . 


! LED que dans les cas usuels la loi ? ! Variable aléatoire 
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REMARQUE Si A = P(Q), toute application X sera une v.a. puisque Xl (x) € P(Q) 
pour tout x réel. 


1.2 Loi de probabilité 


La propriété résultant de la définition d’une va. va nous permettre de définir la 
probabilité de chacune de ses valeurs possibles x € X(Q) par : 


Py;(X = x)= P{XT(x)} = P {o € Q/X(œ) = x} 


Exemple 2.1 


Si on associe la valeur 1 au résultat impair d’un jet de dé: X-1(1) = {1,3,5}, 
la probabilité de la valeur 1 sera P({1,3,5}) = 1/6 +1/6+ 1/6 = 1/2. 


Cette nouvelle probabilité, définie cette fois sur Q' = X(Q) et notée P,, s’appelle la 
probabilité image de P par X. La relation précédente peut s’écrire schématiquement 
Py (x) = ( Pox Fi) (x). Nous allons vérifier que P, est bien une probabilité définie sur 
Q’. Tout d’abord, l’ensemble d’arrivée de cette application est celui de P, donc [0,1]. 
D'autre part : 


P,(@Q) = P {X71(Q")} = P(Q) = 1; 


enfin, siA, C Q/ , avec À,,N À, = Ÿ pour m £n: 


Py (U) = P {x (Ü .)) = P {Ur (a) = >: {x7'(4,)} 
= Xe (a) 


Très souvent dans la suite, par souci de simplification mais par abus de notation, nous 
noterons P les probabilités images P,. 

L'ensemble Q/ = X(Q) étant dénombrable, il existe une bijection permettant de 
représenter ses éléments par l’ensemble des x,;, i € N. La loi de probabilité P, de X est 
alors définie par les probabilités individuelles : 


P; = Py(X =x) — P{X"! (x;)}, ieN 
On appelle alors distribution ou loi de probabilité de la va. X l’ensemble des 


couples (ex Pi); Si X ne prend qu’un petit nombre de valeurs, cette distribution est 
généralement présentée dans un tableau. 
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Exemple 2.2 


La loi uniforme associée à un lancer de dé à six faces numérotées est présentée dans 
le tableau ci-après : 


Cas particuliers 


Variable certaine. Il s’agit d’une v.a. qui est constante, i.e. qui prend la même valeur 
connue a quel que soit le résultat de l’épreuve : 


P,(X =a)=1 


La masse totale de probabilité est concentrée en a ; on parle de loi de Dirac associée 
à cette variable certaine. 


Variable indicatrice. Soit À € À un événement quelconque; on appelle va. 
indicatrice de cet événement À, la v.a. définie par : 


1 si œEA 
X(œ) = - 
0 si œEA 
et notée X = 1,. Ainsi : 


Py(X = 1) = P {w/o € A} = P(4) 
Px(X =0)=P {Joe A}=P(A)=1-P(4) 


1.3 Fonction de répartition 


On appelle fonction de répartition de la v.a. X, la fonction F définie pour x réel par : 
F(x) = P;{X < x} = P{w € Q/X (œ) < x} 


Il faut noter que beaucoup d’ouvrages utilisent la définition anglo-saxonne où 
F(x) = Py{X < x}. C’est une fonction en escalier, constante par morceaux, continue 
à gauche, définie ici par : 


F9 = } {p/x; < x} 


c’est-à-dire que c’est la somme des poids de tous les points qui sont strictement à gauche 
de x. Les propriétés de F seront étudiées dans le cas d’une v.a. continue. 
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Si par exemple X prend les valeurs x, < x, < ... < x,, on aura F(x) = 0 pour 
x < x,, puis le graphe de F présentera un saut en chaque point x;, jusqu’à la valeur 
F(x) = 1 pour x > x,.. 


À 
Il 
F(x) —_— 
1Pn 
— 
t— — | : 
 P2 
— | | 
Un | | | 
À] X 0 43 Xn-1 Xn X 
Figure 2.1 


On peut déduire de F les probabilités individuelles par : p, = F(x;,,) — F(x;) pour 
1<i<n-—-letp,=1-F(x,). 


Exemple 2.3 


Variable certaine : F(x) = 0 pour x < a et F(x) = 1 pour x > a. 


F(x) À 
1k-------- ————— 
—— |" = 
0 a x 
Figure 2.2 


Exemple 2.4 

Variable indicatrice : F(x) = 0 pour x < 0, saut de hauteur P,(X = 0) = 1 — p avec 
F(x) = 1 — p pour 0 < x < 1, puis saut de hauteur P,(X = 1) = p, puis F(x) = 1 
pour x > I. 
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Figure 2.3 


Exemple 2.5 
Jet de dé : F(x) = 0 pour x < 1, puis sauts de hauteur P,(X = i) = 1/6 aux points 
i=1,..,6 puis F(x) = 1 pour x > 6. 


F(x) } 

À = 2 = ——— 
| _ 
| _ 

we| td 
oo 

Ml ei: 

0 2 3 à 5 6 x 


Figure 2.4 


1.4 Moments d'une v.a. discrète 


a) Espérance mathématique 


DÉFINITION 


On appelle espérance mathématique (expected value) de la va. X la quantité, si 
elle existe : 


E(9= D Pix; 


iEN 


Il s’agit d’une moyenne en probabilité, ou moyenne pondérée, des valeurs x; que peut 
prendre la v.a. X, par les probabilitiés correspondantes p;. Chaque probabilité p; peut 
aussi s’interpréter comme la masse ponctuelle du point w, d’abscisse x; et E(X) est alors 
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le centre de gravité, ou barycentre, de ces points affectés de masses. C’est une valeur 
numérique constante qui est la valeur moyenne, en probabilité, de X. Notons que si X 
prend ses valeurs entre x, et x,, on aura bien sûr x, < E(X) < x,.. 

Si X ne prend qu’un nombre fini de valeurs, le calcul de E(X) peut se faire à l’aide 
du tableau de la distribution comme ci-après : 


Pix; — | E(X) 

Exemple 2.6 
Si X est la v.a. qui code 0 le résultat pile et 1 le résultat face d’un lancer de pièce de 
monnaie : 

E(X)=0X P,;(X =0)+1x P,(X = D=0xS+1X5=3 
la valeur moyenne en probabilité de X est 1/2, bien que X ne prenne jamais cette 
valeur. 
Exemple 2.7 


Pour une v.a. indicatrice : 


E(X)=0 x P,(X =0)+1X P,(X = 1)= P(A)=p 


Exemple 2.8 
Pour le jet de dé : 


Exemple 2.9 


Dans le cas de la loi uniforme sur X(Q)= {x Has Se c’est-à-dire avec équiproba- 
bilité de toutes les valeurs p;, = 1/k, on obtient : 


k 
1 
E(X)= Ds 
i=1 


et dans ce cas E(X) se confond avec la moyenne arithmétique simple x des valeurs 
possibles de X (cependant la notation x pour l’espérance est à proscrire en général 
car ce n’est que dans ce cas particulier que E(X) = x). 


À l’origine des probabilités, la quantité E(X) a été introduite pour traduire la notion 
de gain moyen, ou espérance de gain, la v.a. X représentant la valeur du gain à un certain 
jeu. 
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Exemple 2.10 
Deux joueurs À et B jouent avec un dé, le joueur B gagnant les mises si le résultat est 
supérieur ou égal à trois ; sinon, c’est À qui gagne. La question est de savoir quelles 
doivent être les mises respectives a et b de ces deux joueurs pour que le jeu soit 
équitable. 
Les gains respectifs de ces deux joueurs sont représentés par les v.a. : 
a+b 2/6 a+b 4/6 

x,= {0 4/6 x3= {0 2/6 
soit les espérances de gain E(X,) = (a + b)/3 et E(X3) = 2(a + b)/3. Le jeu est 
considéré comme équitable si la mise est égale à l’espérance de gain, ce qui conduit 
aux conditions (a + b)/3 = a et 2(a + b)/3 = b d’où b = 2a, résultat intuitivement 
évident puisque le joueur B a deux fois plus de chances de gagner. 


Théorème 2.1 SR neneereereeeeee eee eee eee eee eee e 


? Les propriétés de l’opérateur espérance mathématique sont celles du signe somme. 


P, | Si on ajoute une constante à une v.a., il en est de même pour son espérance : 


E(X + a) = E(X)+a,aeR 


? résultat qui se déduit de : 


Dri(xi+a)= Ÿ px,+a 
i i 


espérance : 


E(aX)=aE(X).aeR 


: il suffit d’écrire : 


> ax, me DZ 
î î 


| si elles existent) : 


E(X + Y) = E(X) + E(Ÿ). 


La première espérance fait intervenir deux v.a. distinctes et se calcule donc par : 
i rapport à la loi du couple (X, Y) qui est définie par les probabilités : 


P,| Si on multiplie une va. par une constante, il en est de même pour son : 


P, | L’espérance d’une somme de deux v.a. est la somme des espérances (bien sûr : 
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Les deux autres espérances se calculent par rapport aux lois marginales de X et É 
 Ÿ qui s’obtiennent par sommations de la loi du couple : 


Pi. — 2P;; = P;(X = x) 
j 
ED y) 
On calcule alors : 


HE 2 x,+7;) = = Lot Lo 


=>: DID Zn + 2P. V; 


? On peut résumer ces trois propriétés en disant que l’opérateur espérance mathéma- : 
? tique est linéaire : 


EUX +uY)=1E(X)+uE(N), ViER, VueR 


REMARQUES L’espérance d’une constante réelle a est égale à la valeur de cette 
constante : E(a) = a. 


Si g est une fonction continue quelconque, alors : 


Elg (O1 = Ÿ pig (x) 


iEeN 
b) Variance 


Il s’agit d’un indicateur mesurant la dispersion des valeurs x, que peut prendre la v.a. X, 
autour de la moyenne en probabilité E(X) et défini par : 
2 
VO) = Ÿ pi [x - EX)] 
IEN 
lorsque cette quantité existe. 


C’est l’espérance mathématique du carré de la v.a. centrée X — E(X) : 
V(X) = EIX - EX) 


moment centré d’ordre deux. On note cette quantité V(X) = 0% 6x désignant alors 
l’écart type (standard deviation) de X qui s’exprime dans les mêmes unités de mesure 
que la variable. 


Exemple 2.11 
Lancer de pièce : 


_ f O(pile) 1/2 
Re 1/2 
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On avait calculé E(X) = 1/2, d’où : 


1 ENT 1 1 1 1 
DOM OELS 
FE) 3 (0 2) Ÿ5 2 8'8 


Exemple 2.12 


Pour la v.a. indicatrice : 
V(X) = E(X — p} = p(1- p} +(1- p)(0— p) 
=p(l—-p)(-p+p)=p(l-p) 


Exemple 2.13 
Pour la loi uniforme sur X(Q) = {xu si %) nous avions obtenu E(X) = x, d’où : 
k l k 
V (X) = (% — x)? = = =) 
(x) 2 Ÿ=Z x ) 


et la variance se confond ici avec la variance empirique des valeurs possibles 
de X. 


Cet indicateur de dispersion vient compléter l’information sur la distribution, fournie 


par la valeur moyenne. 


Exemple 2.14 


Considérons les deux distributions suivantes : 


X 2 4 6 Y | —-4 3 33 
1/4 | 1/4 | 1/2 1/2 | 1/3 | 1/6 


Elles ont comme valeurs moyennes : 
E(X)= 3+1+3=4,5 et EM=-2+14 € =4,5 


donc même centre de distribution. Par contre : 
E(X?)=1+4#18=23 ee  E(Y?)=8+3+121x5 = 


d’où V(X) = 11/4 et V(Y) = 689/4, valeur très supérieure qui indique une 
dispersion de Y autour de sa moyenne beaucoup plus grande que celle de X. 
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Théorème 2.2 ÉEErEEEee eree seen eee , 


P, | Par définition : 


V(X) > 0 
| avec : 
V(X)=08 p[x,- EXI=0VIENS x, = E(X) Vi EN 


la variance ne peut être nulle que si X = E(X) avec une probabilité égale à un, 1.e. 
É si X est une v.a. certaine : P,{ X = E(X)} = 1. È 


P, | Pour tout réel a : 


VX + a) = V(X) 
E c’est-à-dire que le moment centré d’ordre deux est invariant par translation ou E 
changement d’origine. 
Ceci provient du fait que X + a — E(X + a) = X — E(X). 


P, | Pour tout réel a : 


V(aX) = a V(X) 


É un changement d’échelle modifie la variance; ceci est dû au fait que 
i [aX — E(aX) = a°[X - E(X)Ÿ. 


P, | Pour le calcul de la variance, il est souvent préférable d’utiliser la formule 


développée : 
VX) = E(X?) - E°(X) 
qui se déduit des propriétés de linéarité de l’opérateur espérance : 


V(X) E[X?-2XE(X)+ E(X)] = E(X?) -2EX) + EX) 
E(X?) - EXX) 


P. |Si X et Y sont deux v.a. indépendantes, alors : 


VX +Y)=V(X)+V(Y) 
cette propriété se déduisant du fait que dans ce cas E(XY) = E(X)E(Y), que l’on 
démontre aisément à partir de la condition d’indépendance qui s’écrit : 

PrntX=x,Y=y;}=P;{X=x,}P,{Y =y;})  Viel,vjeJ 


OU p;; = p; Xp; avec les notations du paragraphe précédent. En effet : 
EXT) = » Vox ) nu > njÿ; = ECX)E) 
i J î j 


LCEPEETELEL EEE EEE TELE ELEC EL ELEC EL ELEC EE ELEC EEE EEE EEE EEE EE ECECEE EEE ECEEPEEETECENCEEENECE EEE EEE EEE CEE EEE LS 
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ent 9 000 0 0 0 à à 0 à à à à à 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 à à à à à à à à à à à à 9 à 9 9 0 0 0 0 0 8 0 8 0 0 8 0 0 0 0 0 0 0 0 0 0 0 0 0 0000000000 n es 


d et alors : 
V(X+Y)=E(X+Y) -[E(X+Y)P 
= E(X?) + E(Y?)+2E(XY) - EXX)- E(Y) -2E(X)E(Y) 
= V(X) + V(Y) +2[IE(XY) — E(X)E(Y)] 
On définit la covariance par Cou(X, Y) =E(XY) — E(X)E(Y) et on a donc dans 
? le cas général : È 
V(X +Y)=V(X)+V(Y)+2Cou(X,Y) 


REMARQUE Considérons la fonction g définie pour f réel par : 
gO=EX-9 = Ÿ px; -1) 
C’est un polynôme du second degré en f, de dérivée : 


g'@=-2 À px; 1) =-2[E(X) - 1] 


qui s’annule en changeant de signe pour 1 = Y p;x;, = E(X); comme g”(#) = 2 > 0, 


1 
g est minimum pour { = E(X), ce minimum étant la variance de X. Ainsi, E(X) est 
solution du problème : 


min E(X — 1) 
1tER 


On peut également retenir comme caractéristique de valeur centrale la médiane Md, 
notamment dans le cas où l’espérance n’existe pas, nombre qui se définit par : 


P(X < Md)< 3 < P(X < Md). 


Elle vérifie aussi : 


EIX- Md| = inf EIX -{ 
1E 


c) Moments non centrés et centrés 


On appelle moment non centré d’ordre r € N* la quantité, lorsqu'elle existe : 


m,(X)= Ÿ px = E(X"). 
iEeN 
Le moment centré d’ordre r € N* est : 
a, à) = Ÿ p; fx; - EC)" = ELX - E(X)r'. 
iEeN 
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Notons que ce moment centré peut s’exprimer, à partir de la formule du binôme, 
en fonction des moments non centrés m,,m,_,...,m,. Les premiers moments sont : 


mi (X) = EX), (À) =0, u3 (À) =m (X) mm (N) = V(X) 


) Variable aléatoire réelle continue 


2.1 Définition 
On appelle v.a. réelle définie sur (Q, 4) une application X : Q — R telle que pour tout 
intervalle Z CR on ait: 


X7()={HEQ/X(œ)EI}E A 


Cela exprime que l’image inverse d’un intervalle quelconque est un événement. II 
suffit en fait de vérifier que pour tout réel x : 


X71(J-00, x[) € À 


Exemple 2.15 
La durée de vie d’une lampe ou le salaire d’un individu tiré au sort dans une 
population sont représentés par des v.a. continues. 


2.2 Loi de probabilité 


Elle est déterminée ici par la fonction de répartition (f.r.) F, définie pour tout x réel par : 
F() = Py(X < x) = P{XT"(J-c,x[)} = P {wo E Q/X(o) < x} 


qui représente la probabilité que X soit strictement à gauche de x. 


2.3 Propriétés de la fonction de répartition 


P, | Elle est croissante au sens large. 


En effet, pour x < yona(X < x) = (X < y) et par conséquent 


Fo) = Py(X < x) < PyX < y) = FO). 


P, | Elle prend ses valeurs entre 0 et 1 : 


O0 < F(x) < 1 avec lim F(x) =0 et lim F(x) = 1 


En effet, F(x) est une probabilité et quand x — —c l’intervalle ] —co, x[ devient ÿ 
et X-! (a) = f; quand x — +c, l'intervalle ] —co, x[ devient R et X-!(R) = Q. 


P, | Elle est continue à gauche : 


dim F(x— h) = F() 
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car l'intervalle ] — co, x — À[ ne contient jamais le point x et devient donc l’intervalle 
]—co, x[ quand h — 0*. 

On peut établir que ces trois propriétés sont caractéristiques d’une fonction de répar- 
tition. Si on retient la définition F(x) = P,(X < x), cette fonction F est alors continue 
à droite. 


Par contre, pour tout h > 0 l’intervalle | —o, x + h[ contient toujours le point x et 
devient l’intervalle ]—co, x ]=] —co, x[ U {x} quand h — 0*. Par conséquent : 


lim F(x+ h) = F(x) + P;(X = x) 
—0+ 
Aüïnsi, aux points x de discontinuité de F, son graphe présente un saut de hauteur 


P,(X = x) (voir figure 2.5) : 


P{X = x) 


Figure 2.5 


P, | La probabilité de l’intervalle [a, b[, pour a < b, se calcule par : 


P,(a< X < b)= F(b) — F(a) 


On a en effet ] —oo, b[=] — co, a[U[a, b[ donc : 


P,(X < b)= P,(X < a)+ Py(a < X < b) 


2.4 Loi continue 


Si la fonction F est continue, i.e. continue à droite, on dit que X est une variable 
aléatoire réelle continue. Dans ce cas, pour tout réel x : 
P,y(X = x) =0 


c’est-à-dire que la probabilité d’un point est toujours nulle, ce qu’on traduit en disant 
que la loi est diffuse. Dans le cas où certains points ont une probabilité non nulle on dit 
que la loi est mixte, comportant une partie continue et une partie discrète correspondant 
à ces points. 


Exemple 2.16 
Considérons la fr. F définie par : 
si x<0 


si O<x<l 
F (x) = 
si 1<x<2 


= NDIXBIX © 


Si 2<Xx 
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Cette fonction est continue pour x = 0 et x = 2. Par contre, si elle est bien continue 
à gauche en x = 1, comme toute f.r., avec Jim F(-h)=F(1)= à elle n’est pas 
0+ 


continue en ce point Car : 
: | 1 
lim F(+h)= lim =({+h)=-=F(D+P.(X=I1 
RRQ nn 2 ) 


et par conséquent il s’agit d’une loi mixte, avec une partie continue sur les intervalles 


]—c, If et ]1, +oo, et une partie discrète concentrée au point 1 avec P, (X = 1) = r 


Exemple 2.17 
On peut donner également un exemple plus concret, qui est celui d’une va. X re- 
présentant la durée de vie d’une ampoule qui suit une loi exponentielle (cf. chap. 3, 
$ 2.2). S’il y a une probabilité p > 0 que cette ampoule claque lorsqu’on l’allume, la 
fr. de X est alors définie par : 
0 si x<0 
QUE es _p}(l—e*) si x>0 


avec donc une masse non nulle au point x = 0: 


dim F(0+h)=p= Px(X = 0) 


2.5 Loi absolument continue 


La valeur moyenne de la probabilité d’un intervalle de longueur h > 0 est : 


F(x + h)— F(x) 


1 
FPxG < X <x+h)= - 


et représente donc une densité moyenne, puisqu’étant le « poids » (probabilité) de l’in- 
tervalle, divisé par sa longueur. Si on fait tendre cette longueur vers O, la limite, si elle 
existe, représentera la probabilité d’un intervalle de longueur infiniment petite dx. Ce 
sera le cas si F admet une dérivée f : 


lin = LFG + h)— FOOD = F'() = 6 


Dans ce cas, l’équivalent de la probabilité du point x pour une loi discrète peut s’écrire 
symboliquement P,(x < X < x + dx) = f(x)dx, la fonction f = dF/dx étant 
appelée densité de probabilité de la v.a. X dont la loi est alors qualifiée d’absolument 
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continue. Dans ce cas la loi de X est déterminée par sa densité f puisque F est définie 
comme la primitive de f qui s’annule pour x = —o : 


FG= ]| fdt 


fa) À 


Figure 2.6 


NB On peut trouver des exemples, assez complexes, où F est continue et strictement 
croissante mais n’admet pas de densité, c’est-à-dire de cas où la loi est continue mais pas 
absolument continue. Dans la pratique, les lois usuelles que nous rencontrerons seront 
soit discrètes, soit définies par une densité. 


Théorème 2.3 RÉEEEEEEEEEErTEEETEEEEEer er een eee eee ee ee eee eee EE x, 


P, | Une densité est positive : 


f >0; 


i propriété immédiate puisque f est la dérivée d’une fonction croissante au sens large. 


P, | Une densité est intégrable sur R, d’intégrale égale à un : 


+00 
/ fG@)dt = 1; 


ceci provient du fait que F(+o) = 1. 


Ces deux propriétés sont caractéristiques d’une densité de probabilité, c’est-à-dire 
? que toute fonction positive et intégrable sur R définit une loi de probabilité. 


P, | La probabilité d’un intervalle s’obtient en intégrant la densité sur cet intervalle : 


X 
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CLLEECELELEEEETELELEC EEE EC ELEC EEE TEE EEE EEE EE EECEP EEE EEE EECEECECECEECECEEECEE EEE EE EECET EC EC EEE ECC EEE ETSS 


Pr SX < x) = FO) = FE / roar- | f@dt 


= | f(Odt+ fOdt 


CO X] 


2.6 Moments d'une v.a. absolument continue 


a) Espérance mathématique 


Elle est définie par : 
+00 
E(X) = / xf (x)dx 


lorsque cette intégrale généralisée existe, c’est-à-dire est convergente. Les propriétés de 
l'espérance sont celles de l’intégrale et sont identiques au cas discret, i.e. il s’agit d’un 
opérateur linéaire : 


Théorème 2.4 - SÉACEEEEEEEEETENEEEESErEsEEee eee ee cernes eee eee eee ee EEE . 


P, | Pour tout réel a : 


E(X + a) = E(X)+ a 


P, | Pour tout réel a : 


E(aX) = aE(X) 
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CELCECEECECCECEEEECELEEEEEEEEEEEEEEEEEEEEEEEEEEEEECCECECCECCCCCCECEPCEPEECEEEEECEEEEEEEEEEEEEECEECEC ECC ECC EPCEPEEEEEPEEEEEEETS 


Si X et Y sont deux v.a. qui admettent une espérance : 


E(X + Y) = EX) + EC) 


b) Variance 


Elle est définie par : 


+00 
V(X) = EIX - E(X)Ÿ = / [x - ECO f()dx 


— CO 


= E(X?) - EX) = 6 (X) 


lorsque cette intégrale généralisée existe. Ses propriétés sont identiques au cas discret : 


Théorème 2.5 RECEEEEEEEEETEEEETEEEEEEEEEEceenc encens : 


Pi 


C’est une quantité positive : 


v(X) >0 


i avec V(X) =0 & X est une v.a. certaine (donc une v.a. discrète !). 


P 


P; 


Pour tout réel a : 
V(X + a) = V(X) 
Pour tout réel a : 
V(aX) = &V(X) 
Si X et Y sont deux v.a. indépendantes admettant une variance : 


V(IX+Y)=V(X)+V(Y) 


c) Moments non centrés et centrés 


Le moment non centré d’ordre r € N* de X est la quantité, lorsqu'elle existe : 


+00 


m,(X) = E(X") = Î x" fG)dx 


— CO 


Le moment centré d’ordre r € N* de X est la quantité, lorsqu'elle existe : 


+00 


u 0 = EX EG = | [x — E(X)T fG)dx 


— CO 
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Paramètres d'asymétrie. L’asymétrie d’une distribution peut se caractériser par 
le moment centré d’ordre trois. 


La distribution est : 
— symétrique si u3 = 0; 
— dissymétrique étalée vers la droite si y, > 0; 


— dissymétrique étalée vers la gauche si y3 < 0. 


D ———————— Be 


H3>0 H3 = 0 3 <0 


Figure 2.8 


Pour obtenir un paramètre indépendant des unités, on considère les coefficients de 
symétrie (skewness ) : 


— de Pearson : 
2 
H3 
Bi — 3 
H; 

— de Fisher : 

4 — #5; 
ne 


Paramètres d'aplatissement. Ils sont calculés à partir du moment centré d’ordre 
quatre ; ce sont les coefficients d’aplatissement (kurtosis), invariants aussi par change- 
ment d’échelle ou d’origine : 


— de Pearson : 


— de Fisher : 


Le terme de comparaison est ici la loi normale standard pour laquelle f, = 3, avec 
Y2 > 0 pour une distribution plus aplatie que la distribution normale de même moyenne 
et de même écart type. 
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2.7 Changement de variable 


On cherche à déterminer la loi de probabilité de la v.a. Y = h(X), connaissant la fonction 
de répartition (f.r.) de la v.a. X. Ceci se fera sans difficulté si h est une application réelle 
continue et bijective, donc inversible. La fr. de Y est en effet définie par : 


G(y) = Py;(Y < y) = Py {h(X) < y} 


Nous allons alors distinguer deux cas : 


— h est croissante : 
h(X)<ysSxX<h!(y 


et G(y)= P; {X <h°1(»)}=F [ho] 


X h\(y) 


h(X) 
Figure 2.9 
— h est décroissante : 
h(X)<ysxX>h!(y 


et GO) = Py{X > hp} =1-F [ht] 


L- 


h\(y) x 


h(X) 


Figure 2.10 
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Si X admet une densité f et que h est de plus dérivable, on peut déterminer la densité 
g = dG/dy de Y par dérivation. Dans le premier cas (h' > 0) : 
dF 


: LRO E LEO) 
FT ra EE di dy ht 


Dans le second cas (k” < 0): 


à dk __ fr" O) 
du lu=n(y) dy h' [ht (y) 


gO) = — 


Dans les deux cas la densité de Y peut s’écrire sous la même forme : 
LRO) 
SOS sr 
ja" [at |] 
REMARQUE Même dans le cas où la fonction h n’est pas inversible, on peut 
parfois déterminer la loi de Y=h(X). Considérons par exemple A(x)=x? ; la fonction À 


n’est pas injective car A(—x) = h(x) pour tout x réel et cependant on peut déterminer la 
loi de la v.a. positive Y = X?, car pour y > 0: 


X<ye-ÿy<X< y 


d’où G(y) = P,;(Y < y) = Px (—-4/y < X < y) = F(ÿ»)-F (-—4>). Bien entendu 
pour y < 0 on a G(y) = 0. Si X admet une densité f, alors Y admet comme densité pour 
y >0: 


= Ts (9) + (D) 


Figure 2.11 
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Compléments 


3.1 Application mesurable 


La notion de variable aléatoire réelle peut être définie de fagon générale, sans distinction 
entre les cas continu et discret, en introduisant la notion d’application mesurable. Pour 
cela, nous définissons sur l’espace métrique R sa tribu borélienne, notée B3, qui est la 
tribu engendrée par les intervalles ouverts (ou fermés), c’est-à-dire la plus petite tribu 
contenant cette famille d’intervalles. Une variable aléatoire réelle X est alors définie 
comme une application mesurable de (Q, 1) dans (R, B) , c’est-à-dire telle que : 


VBEB, X '(Bje A 


En fait, pour vérifier que X est bien une application mesurable, il suffit de vérifier 
cette condition pour une famille particulière d’intervalles, comme celle des ouverts de 
la forme ] —c, x[, c’est-à-dire de vérifier que : 


VxER, X7!(]J-00,x[) € À 


Notons comme propriété utile que toute application continue de (R, B) dans (R, B) 
est mesurable. 


3.2 Densité 


Si la loi de probabilité P, d’une v.a. X admet une densité, celle-ci est la dérivée de la 
fonction de répartition de cette loi. Cependant, la définition d’une densité ne se fait pas 
à partir de cette notion analytique de dérivabilité, mais à partir de notions plus com- 
plexes que nous allons évoquer. Cela nécessite d'introduire la mesure de Lebesgue 1 
sur (R, B), qui est la mesure diffuse prolongeant la notion de longueur, la mesure de 
l'intervalle ]a,b] étant définie par À (Ja, b]) = b — a. Si pour tout borélien B € B tel 
que À(B) = 0 on a P,(B) = 0, on dit que la loi de probabilité P, de X est absolument 
continue par rapport à la mesure de Lebesgue et alors cette loi admet une densité. 


3.3 Support 


Le support d’une loi P, est l’ensemble de tous les points x tels que tout intervalle ouvert 
contenant x a une probabilité positive : 


Ve > 0, P,{Ix-e,x+el} > 0 


Exemple 2.18 

Soit P, la loi de probabilité définie sur l’ensemble des rationnels Q = {qu}, =ù 
par Py (du) = 7 C’est une loi discrète mais dont le support est pourtant R car 
tout intervalle ]x — €, x + e[ contient au moins un rationnel, quel que soit £ > 0 


et par consèquent P,(]x — €, x + ef) > 0 pour tout x ER. 


@ L'essentiel 
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ÉCCLELECELCELEELELECEECECECECEECECECECEECECECECCECECECECCECECECECEECECECECEECECECECCECECECECEECECE CE EEEC EEE ECECECEECEECE CEE EEE EEE CEE CECCECE CCC 


O Une variable aléatoire (v.a.) X est une application qui à un événement 
fait correspondre un nombre. 


@ :: loi de probabilité d'une v.a. peut toujours être définie par sa fonc- 
tion de répartition (f.r.) F, où F{x) représente la probabilité de toutes les 
valeurs strictement inférieures au réel x. 


[3] Si l'ensemble des valeurs possibles de X est dénombrable, i.e. s'il existe 
une bijection permettant de le représenter par l'ensemble des x, ie N, 
la v.a. est dite discrète et sa loi est définie par l'ensemble des couples 
(x Piien avec p; = PXX= x). 


@ Si l'ensemble des valeurs possibles de X est un sous-ensemble non 
dénombrable de R, la v.a. X est dite continue. Dans le cas où sa f.r. 
F est dérivable, sa loi est définie par sa densité de probabilité f qui 
est la fonction dérivée de F : f=F. 


@ Les deux principales caractéristiques d'une distribution de probabilité 
sont : 
- l'espérance mathématique E(X, caractéristique de valeur centrale : 
+00 
E(X) = Ÿ. p;x; ou E{X) = / xf(x) dx 
IEN —æ 
— la variance V{X) qui est une caractéristique de dispersion autour du centre : 
VO9 = EIX- EL = EX) — E*(0 
@ 1: calcul de la variance s'effectue presque toujours à partir de la formule 
développée : espérance du carré moins carré de l'espérance. 
Principales propriétés de ces moments : 
VaER,VbeR, E(aX+b) = aEX +b 
V(aX + b) = à WX); 
VAER,VueR, E(X+ yY) = 2E(X + HE(Y) 
et, si les v.a. X et Ÿ sont indépendantes, alors : 


VAX + 4 Y) = VO + VV) 


[7] Pour déterminer la loi de probabilité de la v.a. Y = h(X, même dans 
le cas où la loi de X est définie par sa densité, il est presque toujours 
préférable de déterminer au préalable sa fonction de répartition, et 
éventuellement de dériver ensuite pour obtenir la densité. 
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2.1 


2.2 


2.3 


2.4 


2.5 


2.6 


2.7 


Entrainez-vous (@) 


Soit l’ensemble fondamental Q = {a, b,c} et la tribu associée À = {ÿ,{a,b},{c},Q}, 
les événements a et b étant indiscernables. On définit l’application réelle X sur Q par 
X(a) = 1, X(b) =2 et X(c) = 3. 


1. S’il y a équiprobabilité des événements élémentaires, peut-on définir la loi de 
probabilité de X ? 

2. Si la probabilité P est définie sur (Q, 4) par P({c}) = 1 et si on définit l’application 
Y sur Q par Y (©) = 3 pour tout w de Q, calculer P(X = Y). Peut-on en conclure 
que X et Y ont même loi de probabilité ? 


Soit l’ensemble fondamental Q = {a, b,c,d,e} et la partitition Ï[ = {{a,b},{c,d}, 
{e}} sur laquelle on définit la probabilité P par P({a,b}) = 2/5, P({c,d}) = 
1/5 et P({e}) = 2/5. Deux applications f et g sont définies sur Q par f(a) = f(b) = 
g(c) = g(d) = g(e) = —2, f(c) = f(d) = g(a) = g(b) = 2 et f(e) = 0. Peut-on définir 
la loi de probabilité de l’application X = f /g ? 

Vous participez à un jeu où vous avez la probabilité p de remporter une partie. Si 
vous gagnez deux parties consécutives le jeu s’arrête et vous emportez un gain de 
40—-4N euros, N étant le nombre total de parties jouées. Le nombre maximum de 
parties jouées est fixé à quatre et vous donnez à votre adversaire dans ce jeu la somme 
de 25 euros en cas de perte. Ce jeu vous paraît-il équitable ? 


Une urne contient cinq boules, deux qui portent le numéro 1, trois qui portent le nu- 
méro 2 et quatre qui portent le numéro 3. On effectue deux tirages successifs sans 
remise dans cette urne. On appelle coïncidence le fait de tirer une boule de numéro à 
au i-ème tirage, avec i = 1,2. Déterminer la loi de probabilité de la variable aléatoire 
X qui représente le nombre de coïncidences observées, puis calculer E(X) et V(X). 


Une urne contient une boule qui porte le numéro 0, deux qui portent le numéro 1, trois 
qui portent le numéro 2 et quatre qui portent le numéro 3. On extrait simultanément 
deux boules dans cette urne. Déterminer la loi de probabilité de la variable aléatoire X 
qui représente la somme des numéros obtenus puis calculer E(X) et V(X). 


On considère ñn urnes qui contiennent chacune a boules noires et b boules blanches. On 
tire au hasard une boule de l’urne U; que l’on place ensuite dans l’urne U,. Puis, on 
tire au hasard une boule de l’urne U, que l’on place ensuite dans l’urne U;. Et ainsi de 
suite, la boule tirée de l’urne U,_, étant placée dans l’urne U,,. On note p, la probabilité 
de tirer une boule noire de l’urne U,. Calculer p;,p, et en déduire par récurrence la 
valeur de p,. 


La fonction de répartition F d’une v.a. X est définie par : 
0 si x<l 


1—-1/(1X2) si 1<x<2 


_ 1 < 
AL 1—-1/2X3) si 2<x<3 


1—1/n(n+1) si n<x<n+l 
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2.8 


2.9 


2.10 


2.11 


2.12 


2.13 


1. Calculer les probabilités p, = P(X = n}, n € N*. 
2. Calculer E(X) et V(X). 


Soit X une v.a. de fonction de répartition F définie par : 


re e*/3 pour x<0 
1 pour x>0 


La loi de X est-elle continue ? 
Soit X une variable aléatoire de densité nulle en dehors de [—1, 1] et dont l'expression 
pour xe[-1,1]est: 
3 
= 24/1 — 
FX) n x] 
Déterminer la fonction de répartition de X. 


Soit X une variable aléatoire de densité f(x) = x pour x € [0,1], f (x) = 2 — x pour 
x € [1,2] et nulle en dehors de ces intervalles. 


1. Déterminer la fonction de répartition de X et en déduire la médiane de cette loi. 


2. Calculer P{|X — 1| < x} pour x réel quelconque. 


Soit X une variable aléatoire de densité f(x) = x + 2, pour x € [—2,-1], f(x) = 
—x + 2 pour x € [1,2] et nulle en dehors de ces deux intervalles. 
1. Déterminer la fonction de répartition de X. 
2. Calculer E(X) et V(X). 
Soit X une v.a. de densité : 

pue {alt 2) S0<x<a 

0 sinon 

où a est un réel strictement positif. 
1. Déterminer la fonction de répartition (f.r.) de X. 
2. Calculer E(X) et V(X). 


3. Soit X,,..., X, des v.a. indépendantes, de même loi que X. Déterminer la f.r., puis 
la densité, de la va. M, = max{X\, 7e A 


Soit X une v.a. de densité f continue et strictement positive, de fonction de répartition F. 
Exprimer à l’aide de f et F la densité et la fonction de répartition de chacune des v.a. 
suivantes. 


1LY=aX+baeR*,bEeR. 


2. Z=IX|. 

3. T =In|X|. 

4. U = F(X). 

5. V = [X], partie entière de X. 
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Variable aléatoire 


2.14 Soit X une variable aléatoire de densité f (x) = n + 2x2 pour x € [-1,1] et nulle en 
dehors de cet intervalle. 


1. Déterminer la densité de la va. Y = X2. 
2. Calculer E(Y). 
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e Solutions 


2.1 


2.2 


2.3 


1.Ona X-!(1) = {a} € A donc l'application X n’est pas une v.a. et on ne peut donc 
pas lui associer une loi de probabilité. 


2. On a: 
P(X =Y)= P({o €e Q/X(œ) = Y(œ)}) = P({c})=1 


donc ces deux applications sont égales avec une probabilité égale à 1 (événement cer- 
tain). L'application Y est constante, avec Y-1(3) = Q, donc c’est une variable aléatoire 
certaine : P(Y = 3) = 1. Cependant on ne peut pas en conclure que la loi de X est la 
même, puisque X n’est pas une variable aléatoire et que cette notion n’a donc pas de 
sens. 


L’algèbre engendrée par la partition est : 
A= {@,{a,b},{c,d},{e},{a,b,e},{c,d,e},{a,b,c,d},Q} 
L'application X ne peut prendre que les valeurs —1, 0 et 1 avec : 
XT'(-1) = {oe Q//f(@) = -g(œ)} = {a,b}U({cd}nt{c,d,e}) 
= {a,b,c,d}Ee À 
X7'(0) = {weQ/f(w)=0}={eJe A 
X7' (1) = {we Q/f(œ)=8()} =({ab}nt{c,d,e})U({c,d}n{a,b}) 
= ÿeA 


Donc X est bien une variable aléatoire dont la loi de probabilité est définie par : 
Py(X = 0) = P({e}) = : et Py(X = —1)= P({a,b,c,d}) = : 


Si le nombre de parties jouées est deux ou trois, c’est que vous avez gagné les deux 
dernières parties et donc P(N = 2) = p° et P(N = 3) = qp° où q = 1-p. Vous avez 
gagné, événement noté E*, à l’issue de quatre parties avec une probabilité qui est : 


PŒN =4}n E*) = pqp° + g°p° = qp° 
La probabilité de perdre à l’issue des quatre parties jouées est : 
Pr =1-P(N=2)-P(N=3)-P({N=4}NnE*) 


L’espérance de gain à ce jeu est alors : 


4 
E(G)= Y'(40-4k)P({N=k}NE*)-25P" 
k=—2 
= 32p° + 28qp° + 24qp° — 25(1 — p? — 2qp°) 


= 57p? + 102qp° — 25 = —102p° + 159p° — 25 


Le jeu est considéré comme équitable si cette espérance est nulle puisqu'il n’y a pas de 
mise initiale. L’espérance est bien sûr une fonction croissante de p, de valeur —25 pour 
p = 0 et 32 pour p = 1. Pour p = 1/2 on obtient E(G) = 2, donc le jeu sera considéré 
comme équitable pour une valeur de p un peu inférieure à 1/2. 
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2.4 


2.5 


2.6 


Variable aléatoire 


Le nombre possible de coïncidences est 0,1 ou 2. Aucune coïncidence correspond au 
tirage d’une boule 2, puis d’une boule 1 : 


3:02. 13 
P(X=0)=PE1)=-x-=— 
( ) @D 5 4 10 
Une coïncidence unique peut se produire au premier ou au second tirage : 
2,1 3.2 4 
P(X=1)=P(AlD+P(22)=ZzX-+=x- = — 
( ) Gh57,02) 5 475 4 10 
Pour deux coïncidences : 
2,3 3 
P(X=2)=P(12)==x-=— 
ESA RSS F2 0 
On calcule ensuite aisément : 
4 6 2 4 12 16 6 _ 3 
Eee et Eee VE E=e 
TT EE” Fo 0-07 9 0, 


On note (1, j) l'événement « avoir tiré les boules i et j » ; pour i = j il y a une seule façon 
d'obtenir ce couple et deux pour i Æ j. On obtient ainsi : 


P(X =0) = P(0,0)=0, 


1.2.2 
(X = 1) (0, 1) 0 9 — ds 
P(X=2) = P(0,2)+ PL D = 2 


P(X =3)= P(0.3)+ PC. D = me 


P(X=4)= P(2,2)+P(G,1)= - 


5° 
12 6 
P(X=5)=P(3,2)= "=, P(X=6)= — 
GR S PASNEeS 


On en déduit : 


E(X)=4 E(x°) A er. 


On obtient : 

_ a 

_a+b 

Pa = P(NN;) + P(N2B;) = P(NDP(NSIN:)+ P(BDP(N; |B:) 
a+l 

la+b+i 


Pi 


a __ a 
a+b+1l a+b 


= p +(1-p;) 


De la même manière : 


a+l 


ITS pEI + (1-p,) 


Es _ 
Pa a+b+l 


Par récurrence, si on suppose que p,_1 = p, on en déduit alors p, = p1. 
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2.7 1. On obtient : 


D =P(X=D=PX<D=FO=I-5=3 


m=P(X=D=P(X<3-P(X <2=FG)-FO)= 3 


et plus généralement pour n > 2: 


L L NE On EN RE ES 
Pn = P(X <n+1) px <= |1 TES | =] 
NES 

n(n2-1) 


2. On obtient comme espérance : 


[se] [se] [se] 
1 2 1 1 1 
D SE) 
_ 2 = G@-DG@+1) 2 = n—1 n+1 
1 1 1 1 1 1 
he (D) 
Al JA RS ST 
1 1 1 1 1 1 
GS D Gh-h) 
n—3 n-1 n-2 n n—1l n+1 
+(2- . )+ 
n n+2 | 
1 1 
ph e 
27 +3 
Par définition : 
PE pete ar — 
| ie 2 =Gm-Du+l1) 


Or le terme général de cette série est équivalent à 2/n, terme de la série harmonique 
divergente, donc cette variable aléatoire n’admet pas de moment d’ordre deux. 


2.8 Par définition F(0) = 1/3 et, comme toute fonction de répartition, on vérifie que F est 
continue à gauche en ce point : 


F(0—h)= se : = F(0) quand h — 0* 


Par contre F(0+0) = 1, donc F est discontinue à droite. La loi est mixte, avec un seul 
point de probabilité non nulle : 


P(X = 0) = F(0 +0) — F(0) = 2/3 
2.9 Ona F(x) = 0 pour x < —1 et F(x) = 1 pour x > 1. Pour —1 < x < 0: 
X 
FG= 2 / a+ 2at=1(+x)/2 
1). 2 
Pour0O<x<1: 


F@=FO+5 f G-0"ar=1- 5-0 
à}; 2 
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2.10 


2.11 


2.12 


Variable aléatoire 
1. On a F(x) = 0 pour x < 0 et F(x) = 1 pour x > 2. Pour0O <x< 1 


X x2 
FE (x) = tdt = — 
(x) k ] 


F@=F(D+ / @-nar= 5 +2x-1 
1 


Pour 1 £<x <2: 


La médiane est le centre de symétrie de la distribution soit M d = 1. 
2. On a h(x) = P(IX — 1] < x) = 0 pour x < 0 et pour x > 0: 


hx) = PA-x<X <1+x)=F(+x)—F(1-x) 
Aünsi h(x) = 1 six > letpour0O<x<1: 
— 
On a F(x) = 0 pour x < —2 et F(x) = 1 pour x > 2. Pour —2 < x < —1: 
ÿ2 
ro= ['e+ai=E+2x+2 
—2 
Pour -1<x<l1: 
F(x) = F(-1) = 1/2 


Pour 1<x<72: 


F(x) = F()+ [+ aa - _ se 
1 


1. La fr. F de X est nulle pour x < 0, a pour valeur 1 pour x > a et a pour expression, 
quand0 <x<a 


r@=2 f(i-tja-2f-2l 2% (x) 


2. On obtient : 
a 2 2 3 
EG =? | EN y-zfé a) a 
a Jo a a \ 2  3a 3 


On calcule de même : 


a 3 3 4 2 
E(x)=2- | ae ND ln | 
a 0 a a \ 3 da 6 


On en déduit la variance : 


= RS el 
V(X)=E(X°) E(X)= 


3. On calcule la fr. de M, : 


n 


Guo= 2 (M <2) = r {f( Xi ex) )}- [Ir (Ce) = rt Go) 


i=1 
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2.13 


64 


On obtient la densité par dérivation : 
8) = GG) = NF" 0 f Go 


Donc pour0<x<a: 


con) et (ET (1-5) 


La méthode la plus simple consiste à déterminer la fonction de répartition (£:r.) de la 
nouvelle variable, puis à la dériver pour obtenir la densité. 


1. Par définition : 
G(y) = PY < y) = P(aX + b < y) = P(aX < y — b) 


Pour pouvoir exprimer cette probabilité à l’aide de la fr. de X, il faut distinguer deux 
cas suivant le signe de a. 


co=P(x<it)-r(2t) 
a a 
2 


sO=6' = 27 


Sia>0: 


Pour a < 0: 


1 y—b 
1026027 ( ) 
a a 
Ainsi, pour a € R*, la densité de Y peut s’écrire : 


0-7 (2) 


lal a 


2. La fr. de Z est définie par H(z) = P(Z < z) = P(|X| < 2), donc H(z) = 0 pour 
z < 0. Pour z > 0: 

H(z)= P(-z<X <z)= F(z) - F(-2) 

h(z) = H'(2) = fa) + f(-2) 
Remarquons que le changement de variable s’est effectué à l’aide de la fonction x + |x| 
qui n’est pas injective et cependant nous avons pu déterminer la loi de | X |. La densité 


de Z présente une discontinuité pour z = 0 puisque À (z) — 2f(0) > 0 quand z — 0*, 
alors que bien sûr H est continue, avec H(z) — F (0*) — F(07) =0 = H(0). 


3. On obtient : 
K(D = P(T <t)=P(In|X| <n=P(IX| <e') = H(e')=F(e!) - F(-e') 
k( = K' (1) = e' [f(e') + F(—e')] 
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2.14 


Variable aléatoire 


4. La fonction F étant dérivable est bien sûr continue; comme de plus elle est 
strictement monotone, elle admet une fonction réciproque F-'définie sur [0,1] et 
aussi strictement monotone, donc pour 0 < u < 1: 


P(U <u)=P{F(X)<u}=P{X<F '(&)}=F[F"(u)] =u 
La variable U = F(X) suit donc une loi uniforme sur [0,1]. 
5. La variable V est bien sûr à valeurs entières, avec pour v € N: 

P(V =v)=P(X]=0)=P(L<X<v+1)=F(v+1)-F(v). 


Pour v entier négatif, on a P([X] = v) = P(v < X < v +1), ce qui ne change rien 
pour la valeur de cette probabilité puisque la loi de X est continue. Ainsi, pour tout 
ve Z,P(V =v)=Fv+1)-F(v). 


1. La fonction de répartition G de Y est nulle pour y < 0 et pour y > 0: 


GH=P(-V5<X < 5) = F(V5)-F(-V5) 


La densité s'obtient par dérivation, soit pour y > 0: 


g(») = NE [f (>) + f (-V»)] L 7 


2. On obtient : 


1 
Ge f (V5+3» 5) dy = À 
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Chapitre &] | 
Lois usuelles 


el Introdt iction CPC EEE EE LEE LEE TE EE LE EL EEE ECC EE CE ECC EE EECEECTEECEETEECEEETEETEECEEEEERTEEENEEEREENRERENER 
: 


Si on améliore la compréhension et l'analyse d'un phénomène complexe par l'introduction 
d'un modèle qui la simplifie, celui-ci ne doit cependant pas être trop éloigné de la réalité. 
Nous allons présenter ici les principaux modèles qui peuvent être retenus pour une modé- 
lisation aléatoire. Ce « catalogue » des lois usuelles distingue encore entre lois discrètes 
et lois admettant une densité de probabilité. 


LEETETECELECE EEE ELEC EE LEE EL EEE EE ELEC EC ELEC EEE EP EEE EE ECEEECEEECECEEEECEECEEE ET EEE EEEE EEE EEE E EEE EEE ET EEE 


M oct M Concencs ces 


les principales lois de È Schéma binômial ou 
Ë probabilité pouvant être retenues dans  : É hypergéométrique 
la modélisation statistique. ? À Loi de Poisson 
que pour certaines lois la Loi uniforme 


convolution donne le même type de loi? ? Loi exponentielle 


CECTETELELECEELELEC ET ELEC EEE ELEC EEE EEE EEE EEE TETELECEEEC EP EE ETES 


Loi normale 
Loi du khi-deux 


Lois usuelles discrètes 


1.1 Loi de Dirac 


Soit a € R un point fixé. On appelle loi de Dirac, notée 6, la loi de la v.a. certaine X 
qui est constante, prenant la même valeur a quel que soit le résultat de l’épreuve : 


X(œ)=a VoEeQ 
Aünsi : 
X(Q)= {a}, P,(X = a) = P{o e Q/X(wœ) = a} = P(Q)=1 


0 si x<a 
F = 
(62 { si xX>a 


Le graphe de F présente un saut de valeur 1 au point de discontinuité a, qu’on appelle 
échelon de Heaviside. 
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Figure 3.1 


Bien entendu, on obtient comme moments : 


E(X)=a et V(X)=0. 


Rappelons que c’est la seule v.a. dont la variance est nulle. 


1.2 Loi de Bernoulli 


Soit À € À un événement quelconque ; on appelle v.a. indicatrice de l’événement À, 
la v.a. définie par X = 1,, c’est-à-dire : 


1 si œEA 
SC 0 si œEA 


Ainsi X(Q) = {0,1} avec: 


P,(X = 0)= P{o € Q/X(œ) = 0} = P(A) = 1 — P(A) 
P,(X = 1)= P{o € Q/X(œ) = 1} = P(A) 


On dit que X suit une loi de Bernoulli de paramètre p= P(A), ce qu’on écrit 
symboliquement X + B(1, p) ou sous la forme suivante : 


1 p 
X = 
hu g=l-p 


La fonction de répartition est définie par : 


0 si x<0 
F(x)=4g si O<x<l 
1 si 1<x 
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Lois usuelles 


F(x) À 
LE-------- RE —— 
\P 
Q |t— 
0 1 + 


Figure 3.2 


Exemple 3.1 


Dans une population de n individus, on associe à chacun d’eux une v.a. de Bernoulli, 
indicatrice de possession d’un certain caractère À : 


X, = 


L 


1 sii possède le caractère À 

O siine possède pas le caractère À 
Le paramètre p = P(A) représente la proportion d’individus de la population qui 
possèdent ce caractère À. 


Les moments de cette loi sont : 
E(X) = 1x P(A)+0 x P(A) = P(A)=p 
E(X?) = 12 x P(A) +0? x P(A) = P(A) 
V(X) = E(X?) - EX) = P(A) - P#(4) = P(A)P(À) = pq 
43(X) = p( = p} + (1 pX0 — p}° = p(1 — pX1 — 2p) 


1.3 Loi binômiale 


s 


Si on effectue n épreuves successives indépendantes où on note à chaque fois la 
réalisation ou non d’un certain événement À, on obtient une suite de la forme 
AAAAA .. AAA. À cet événement élémentaire œ on associe le nombre X (©) de réa- 
lisations de A. On définit ainsi une v.a. X qui suit une loi binômiale de paramètres n 
et p = P(A), caractérisée par X(Q) = {0, 1, ,n} et pour k € X(Q): 


Px(X = &) = “ PQ = p* 


n ; : 
car ( : est le nombre d’échantillons de taille ñ comportant exactement k événements 


À, de probabilité pk, indépendamment de l’ordre, et donc n — k événements À, de pro- 
babilité (1—p}"-#. On écrit X - B(n, p). Pour calculer facilement les moments de cette 
loi, nous allons associer à chaque épreuve i, 1 < i < n, une v.a. de Bernoulli : 


{ 1 siAest réalisé 


X. = — un 
O0 siAest réalisé 


ul 
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On peut alors écrire : 


X=X +X+..+X 


d’où on déduit aisément : 
E(X) = (> x) = > E(X,) = np 
et : 7 É 
V(X) = (> x) = D V(X;) = npq 
i=1 i=1 
car les v.a. X’; sont indépendantes. 


On vérifie bien que c’est une loi de probabilité : 


DETCE x) = > (r}ra-nr+ - + pl" =1 


k=0 


Le calcul direct des moments de X peut s’effectuer à partir de la définition générale, 
mais de façon beaucoup plus laborieuse : 


n n 


EX)=Yk o PQ py À = D een LE 


k=0 


n 


_ n! k on=k 
- 2 reDimeniet 


n n-] 
Giro EN à 
mÈa-nen mp Joe 


np(p +)" = np 


Pour obtenir E(X?) par un procédé de calcul identique, on passe par l'intermédiaire 
du moment factoriel E[X(X — 1)] = E(X?) — E(X) : 


EIX(X - 1)] = D k(k — DEP a" 


9)! 
= n(n — Dp? ) Re Ra = pie 2 


ne e À (T 2) pat == D + 2 


= n(n — 1)? 
on en déduit alors E(X?) = n(n — 1)p? + np, puis : 
VO) = n° p° + np — p) - np? = npq. 
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Lois usuelles 


Exemple 3.2 


Le nombre de résultats pile apparus au cours de n jets d’une pièce de monnaie suit 
une loi B(n, 1/2): 


nn n=(r) (9 (ocre, 


avec E(X) = n/2 et V(X) = n/4. 


Exemple 3.3 


Le nombre N de boules rouges apparues au cours de n tirages avec remise dans une 
urne contenant deux rouges, trois vertes et une noire suit une loi binômiale B(n, 1/3) : 


nan (JE -(Eoeres 


avec E(N) = n/3 et V(N) = 2n/9. 


REMARQUES Si X, » B(n,,p) et X, + B(n,,p), les va X, et X, étant indépen- 
dantes, alors X, + X, - B(n, + n,, p). Ceci résulte de la définition d’une loi binômiale 
puisqu'on totalise ici le résultat de n, + n, épreuves indépendantes. 


Les tables de la loi binômiale ne sont fournies que pour p < 1/2. Pour une valeur 
p > 1/2, on utilise le résultat suivant : 


Py(X =k)=P;(n-X =n-—k)= o BED 


k 
- Le LD onk DE 
= é L à) A —p)""p 


qui exprime que n — X + B(n, 1 — p), loi qui est tabulée puisque 1 — p < 1/2. 


1.4 Loi hypergéométrique 


On effectue n tirages sans remise dans une urne contenant N objets dont N, objets A. 
On note X(w) le nombre d’objets À tirés à l’issue de l’événement élémentaire «. Les 
tirages successifs sont ici dépendants puisque la composition de l’urne est différente 
après chaque tirage, dépendant des tirages précédents. Dans le schéma binômial du pa- 
ragraphe précédent on peut aussi considérer que l’on effectue n tirages avec remise dans 
une urne dont la composition est telle que N,/N = p. Les épreuves successives sont 
alors indépendantes. 


Dans le schéma hypergéométrique ici, ces n tirages sans remise sont équivalents à un 
seul tirage de n objets et il y a donc équiprobabilité de chacun des ( ) échantillons 
n 


possibles. Pour calculer la probabilité d’obtenir k objets À il faut donc dénombrer tous 
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N 
les échantillons qui contiennent exactement k des N, objets À, il y en a ( K) chacun 


— N-N 
d’eux contenant simultanément n — k objets À, il yen a ( mL 
= 


N 


N-N, 


k 


Figure 3.3 


Ainsi, pour tout entier ktelqueO<k<n: 
P,(X = k) = 


il faut bien entendu aussi que k < N, (nombre total d’objets A)etn-k< N-N, 
(nombre d’objets À) d’où les conditions : 


max{0,n—(N-N,)}<k<min{n, Ni}. 


Pour vérifier qu’il s’agit bien d’une loi de probabilité, on utilise le résultat suivant de 


combinatoire : 
y ()( 5 }=(%) 
— k m—k m 


obtenu en effectuant le produit : 


cree (De OSEO 


et en identifiant avec les termes de : 
Qfr+s 
a+sys X ( 1e 
m 
m=0 
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On en déduit que Y (2 é: é … = (). ce qui permet de conclure que 
o\ k n—k n 


D P,(X = k) = 1. La loi hypergéométrique dépend des trois paramètres N, n et N, 
où écrit symboliquement X - H(N,n,N,). 

Pour calculer plus facilement les moments de cette loi, nous allons supposer que 
chacun des objets À est numéroté et nous allons leur associer une v.a. indicatrice de 
tirage : 


X:-= 


L 


( si l’objet À; est tiré PSTEN. 


O0 sinon 


Ces variables permettent d’écrire : 


N\ 
FD 
i=1 
mais notons qu'ici les v.a. X, ne sont pas indépendantes. Elles suivent la même loi de 
Bernoulli dont le paramètre est la probabilité de tirage d’un objet À particulier. Chaque 


échantillon a la même probabilité 1/ ( ; les échantillons qui contiennent l’objet À, 
n 


E as donc : 


sont au nombre de ( 1 


n 
P(X,= 1) = = = + 


On en déduit facilement que : 
N4 
n 
(X) D XD = Na = np 
ayant posé p = P(A)= N,/N. 
Pour calculer V (X), il est nécessaire de déterminer la loi des couples (X';, X;) puisque 
ces variables ne sont pas indépendantes. Le nombre d’échantillons qui contiennent 


simultanément les objets À; et À; est Cr L & donc : 
n—2 
) 

n—2 =] 
POS pet ee enr 
| N MONS 1) 

Ainsi : 

n(n — 1) 
A0 D OT 0 US nn eee 
j j NN =D) 
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et : 
n(n — 1) n 
Cou(X;. X,)= E(X;X;) - E(X)E(X,) = NIN=D  N2 
ARE 6 
N2(N - 1) 


Par conséquent : 


N, N, 
V(X)= (> x) = Y'V(X)+Y Cox, X,) 
i=1 i=1 


i ifj 
nN-n n(N —-n) 
EN, — NN, - 1) —=—— 
AN N AN AN =D 
_,N=nNa (Ma 
_N-1N N 
Soit en posantg=1-p=1-N,/N: 
N -n 
V(X) = 
(X)=npq 
Si la taille N de la population est grande vis-à-vis de la taille n de l’échantillon, on a 
l’approximation : 
N-n - 1-n/N l 
N=-1 1-1/N 
et : 


V(X) = npq 


qui est l’expression de la variance de la loi binômiale B(n, p), c’est-à-dire du cas de 
tirages indépendants (cas limite d’une population de taille infinie). Pour n/N petit et 
N grand on peut utiliser la loi binômiale (plus simple) comme approximation de la loi 
hypergéométrique (cf. chap. 6, 2.9 $2). 


1.5 Loi de Poisson 


Une v.a. X suit une loi de Poisson de paramètre À > 0 si c’est une variable à valeurs 
entières, X(Q) = N, donc avec une infinité de valeurs possibles, de probabilité : 


kEN 


loi qui ne dépend que d’un seul paramètre réel positif, avec l’écriture symbolique 
X » P (1). 


Le développement en série entière de l’exponentielle : 
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permet de vérifier que : 


D PAX =k=1 
k=0 


On peut déterminer quel est l’entier le plus probable en formant le rapport : 


PxX=Rk) a 1! 2 


= RE 
PX=Kk=I) KT Kk 


ce qui montre que pour tous les entiers k inférieurs à on a P,(X = k) > P,(X = k-1), 
donc P,(X = k) est croissant, puis décroissant pour les entiers k > À, le maximum étant 
atteint pour l’entier k = [A]. Pour [1] = 0, les valeurs de P,(X = k) sont décroissantes 
à partir de la valeur maximale qui est P,;(X = 0). Dans le cas particulier où 1 est entier, 
il y a deux valeurs de probabilité maximale qui est P;(X = 4) = P;(X = 2-1). 

Le calcul de l’espérance mathématique se déduit du développement en série entière 
de l’exponentielle : 


co L © à : S qi 
0 
k=0 k=1 ° k=1 : 


Pour calculer la variance nous n’allons pas calculer E(X?) mais le moment factoriel 
E[X(X — 1)] qui s'obtient plus facilement, selon la méthode précédente : 


[se] CO k 
E[X(X - 1)]= 2 k(k — 1)P,(X = k) = e7* pr = D£ 


ee k—2 
= Xe? D À 2e x 
L =) 


On en déduit : 
V(X) = E(X?) - E?(X) = E[X(X — 1)]+ E(X) - E°(X) = À 


REMARQUES Si deux variables suivent des lois de Poisson et sont indépendantes, 
X » P(A)et Y » P (y), alors leur somme suit aussi une loi de Poisson : 


X+Y > P(Ü+ y). 


Le moment factoriel d’ordre trois s’obtient aisément et permet d’en déduire le moment 
centré d’ordre trois : 


E[X(X - 1)(X -2)] = À = E(X°) -3E(X°) +2E(X) 
d’où on déduit : 
u3 = EIX - E(X)P = E(X°) -3E(X?)E(X)+2E%X) => 0 


donc loi dissymétrique à droite. 
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1.6 Loi géométrique ou de Pascal 


On effectue des épreuves successives indépendantes jusqu’à la réalisation d’un événe- 
ment particulier À et on note X le nombre (aléatoire) d’épreuves effectuées. On définit 
ainsi une v.a. à valeurs entières de loi géométrique, ou de Pascal. À chaque épreuve est 


associé l’ensemble fondamental Q = {A 4} et l’événement { X = k} pour k € N* est 


représenté par une suite de k — 1 événements À, terminée par l’événement À : 


Si on pose p = P(A), la probabilité de cet événement est : 


Px(X == (pp 
En utilisant la série entière X x* = 1/(1 — x) pour |x| < 1, puis en dérivant, on en 
k=0 
déduit Y kx*-1 = 1/(1 — x)?, ce qui permet de vérifier que Y P,(X = k) = 1. Ceci 
k=1 k=0 
permet également d’obtenir l’espérance : 
p  _lI 


A—qŸ p 


où on a posé g = 1-p. Le calcul de la variance se fait à partir du moment factoriel : 


E(X)= } kpd° = 
k=1 


EIX(X - D]= KG Dpg*t = pq Ÿ° KG — lg! 7? 
k=2 k=2 


2pq _ 2q 


A-® p 


d’où on déduit : 


V(X) = E[LX(X - 1)] + E(X) - EX) = = 


1.7 Loi binômiale négative 


On effectue cette fois des épreuves successives indépendantes jusqu’à ce que n évé- 
nements À soient réalisés et on note Y le nombre (aléatoire) d’épreuves effectuées. 
L'événement {Y = y}, pour tout entier y > n, est représenté par une suite de la forme : 
AAA... AA... AA 
Re — 


y-1 
qui comporte n — 1 réalisations de l’événement À au cours des y — 1 premières épreuves 
et qui se conclut par un événement À. On en déduit la probabilité individuelle : 


_] 2 
PyY =») = (2 )ra-n . y>n 
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Pour obtenir sans calculs les moments de Y, nous allons décomposer la suite des 
épreuves en n séquences se terminant toutes par un événement À, associant à cha- 
cune de ces séquences une v.a. de Pascal X,,1 < i < n, qui représente le nombre 
d'épreuves nécessaires pour que le i-ème événement À soit réalisé, en comptant à partir 
de la réalisation du précédent À : 

AA... AAAA... AA... AA... AA 
Nr 


x, X X, 


2 n 


Ceci permet de définir la loi de Y, dite loi binômiale négative, comme somme de lois 
de Pascal indépendantes et de même paramètre p : 


F=X;+..+X, 


On en déduit alors facilement : 


E(Y) = nE(X,) = 7 et V(Y)=nVv(X,) = 7% 
P P 
Pour la loi binômiale, le nombre d’épreuves est fixé et on observe le nombre aléatoire 
d'événements réalisés. Pour la loi binômiale négative, au contraire, le nombre de réali- 
sations d'événements est fixé et c’est le nombre d’épreuves nécessaires pour les obtenir 
qui devient aléatoire. 


(à) Lois usuelles continues 


2.1 Loi uniforme 


Une va. X suit une loi uniforme continue si sa densité est constante sur un intervalle 
fini [a, b]|, étant donc de la forme : 


fo = o six Ee[a,bl 


O sinon 


On écrit X + U/([a, b]). Compte tenu du graphe de la densité, on appelle aussi cette 
+00 


loi distribution rectangulaire. La constante k doit être telle que f()dx = 1 soit 


— CO 


b 
[ kdx = k(b — a) = 1, ce qui impose k = 1/(b — a). La densité a pour valeur sur 


l'intervalle [a, b] l'inverse de sa longueur : 


f(x) = —— Vx € [a,b] 


, 
— a 
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fa) À 


1/b — a) 


a b x 
Figure 3.4 


Déterminons la fonction de répartition de X : 


—SiXx <a: 
F= | Odt=0 
—sia<x<b: 
ê 1 x—a 
F(x) = Odt + —— dt = 
@) Î. . b—-a b—a 
—si b < x : 


: Fo 4 : b—a 
FG= | Odr+ | a+ | Odt = = | 
— a b—a b b—a 


On obtient donc : 


0 si x<a 
F(x) = à a<x<b 

b—-a 

1 si b< x 
F(x) À 


0 a b < 


Figure 3.5 


Le fractile d’ordre p € J0,1[, qui est défini par F (X,) = p, a pour valeur ici 
X,=4a+(b—a)p. 


La densité est discontinue en a et b mais la loi est absolument continue et la fonction 
de répartition est bien sûr continue en ces points. 


© Dunod — Toute reproduction non autorisée est un délit. 


Lois usuelles 


Dans le cas particulier où a = 0 et b = 1, on a X + T/([0,1]) avec: 


1 = { si xe[0,1] 


O sinon 

O0 si x<0 
ro {à si O<x<l 

1 si 1<x 


La probabilité d’un intervalle [x,,x,] inclus dans [a, b] est proportionnelle à sa 


longueur : 


X2 — X] 
b—a 


X) X) 
Pyx; <x<x)= f roax = | dx = 
Xi dx, 


Calculons l’espérance : 


+oo b b 
EQo= f «fox = | a Ë _ b+a 


s b—a 


c’est-à-dire que le centre de la distribution est le milieu de l’intervalle, résultat prévisible 
puisque la loi est uniforme sur cet intervalle. Dans le cas particulier où a = 0etbh=1 


on obtient E(X) = 1/2. 


Calculons maintenant la variance : 


+00 1 b 1 
EQ= / x? f (x)dx — —/ x?dx = p | 


CO 


= 0 + ab + d°) 
(b— a) 


V(X) = E(X?) - EX) = 


Donc V(X) = 1/12 dans le cas de la loi uniforme sur [0,1]. 


2.2 Loi exponentielle 


La loi exponentielle de paramètre 8 > 0 est celle d’une variable positive de densité : 


ex si O0<x 
69 = {0 si x <0 
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fx) À 


Figure 3.6 


La variable associée X est souvent utilisée pour représenter une durée de vie (durée 
de vie d’un matériel donné, durée de chômage, durée d’hospitalisation ...). On écrit 
X - €(8). Sa fonction de répartition est bien sûr nulle pour x < 0, et pour x > O on 
obtient : 


F(x) = 8 | eFdt=[-e D =1-e 
0 


F(x) À 
1 
0 sd 


Figure 3.7 


On calcule l’espérance en intégrant par parties : 
+00 + +00 1 
E(X) = o | xé “dx = [xe #1," + / e dk=- 
0 0 0 
On calcule de même, en intégrant par parties, le moment d’ordre deux : 


+00 
E(X?) = 8 | x'e ax = [-xe Ti +2 | 
0 0 


+oo 


Lx 2 2 
dx = =E(X) = — 
xe x 2 (X) m 
d’où on déduit : 
1 


VO = 
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2.3 Loi normale ou de Laplace-Gauss 


C’est la loi d’une variable aléatoire X à valeurs dans R, de densité : 


F@) = 


(ox 


qui est définie par deux paramètres m et o > 0 dont nous verrons l’interprétation un peu 
plus loin. On note X = N(m, 6). Bien entendu, s’agissant d’une densité de probabilité, 
on en déduit la valeur de l’intégrale suivante : 


+00 à ; 
d emo gx = 6 V2x 


CO 


Les remarques suivantes vont nous permettre de préciser le graphe de f. 


REMARQUES 


1. On peut constater que f(2m — x) = f(x), ce qui indique que le graphe de fest 
symétrique par rapport à la droite verticale x = m. 


2. L'expression (x — m)? est minimum pour x = m, ce qui va correspondre à un 
maximum pour fde valeur : 


1 
oV2r 
3. Pour calculer facilement la dérivée, considérons : 


In f(x) = —Ino V2x — li — m) 
262 


f(m) = 


D'où en dérivant : 


f'@) see 2 pl on — 
FD = (x m) et of (x)=(m—x)f(x) 


Et en dérivant à nouveau : 
cf") =-fG)+(m- 2x f' (0) 
d’où on déduit : 
f" ) = (mx) FN) — of) = (mx - 0)(m—x + 06)f(x) 


donc f”’ s’annule en changeant de signe pour x = m—c et x = m+50, ce qui correspond 
à deux points d’inflexion pour le graphe de f. 


4. Enfin, quand x devient infini, alors f(x) — 0 donc l’axe des abscisses est asymptote 
au graphe. 


Toutes ces remarques permettent de tracer le graphe en cloche de la densité f. 
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fx) À 


Figure 3.8 


L'intégrale Vel x f(x)d x est convergente en raison de la présence de l’exponentielle, 
donc E(X) existe et sa valeur ne peut être que m en raison de la symétrie de la densité 
par rapport à cette valeur. Vérifions-le en écrivant : 


+00 +00 
EGO= f xrGdx = ] (x-m+m)f(x)dx 


CO 


+00 +00 
=m | rooax+ (x — m)f(x)dx 


[e) 


+00 
=m+ | (x — m)f(x)dx 


Lee] 
l’intégrande étant une fonction impaire de x — m = u, l’intégrale est nulle puisqu'elle 
est convergente et qu’on intègre une fonction impaire sur un intervalle centré à l’origine. 
On retrouve bien l'interprétation du premier paramètre comme moyenne de la loi : 


E(X) = m. 


Pour calculer le moment d’ordre deux, on fait le changement de variable 
u=(x-m)/0 : 


+00 … 02 
EX?) = — / x2 exp RÉ 
o V2x /- 26 


+00 
= ee / (ou? + 2mou + me“ /?qu 
V27x /-0 


o2 +00 ; 
= / we" qu + m° 
27 J-œ 


2x 


que l’on intègre par parties : 


o2ue-"/2 s 6? LE 
ET ||, + | e"/2qu + m° = 0° + m 


V2r | V2r 
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d’où : 
V(X) = 6°? 


le second paramètre étant donc l’écart type o. On obtient aussi E(X — m)° = 0, comme 
d’ailleurs tous les autres moments centrés impairs qui sont nuls, et E(X — m)* = 30“. 


a) Loi normale centrée réduite (loi normale standard) 


En faisant le changement de variable U = (X — m)/o, c’est-à-dire en centrant et en 
réduisant, on obtient une v.a. de loi standard, de moyenne nulle E(U) = 0 et de variance 
unité V(U) = E(U?) = E(X -— m)/o° = V(X)/0° = 1, donc de densité : 


qu) = er"? 
27 


+00 
On peut donc en déduire la valeur de l’intégrale / e “qu = V2r. 


— C0 


On obtient les dérivées à partir du logarithme, Inq(u) = —InV/2x — u?/2 : 
g'(u) =-up(u) et p"(u) = -p(u) -up'(u) = (° — Du) 


La valeur maximale de @ est o(0) = 1/V2x = 0,3989 et les valeurs décroissent 
rapidement, avec par exemple @(2) = 0,0540 et g(4) = 0, 0001. 


La fonction de répartition est définie par : 


bel) eh 


27 /-x 
et n’est pas exprimable au moyen d’une fonction usuelle. Les valeurs de ® sont fournies 
dans les tables statistiques (table 1) pour x > 0. Pour x < 0, on utilise le fait que 
est une fonction paire, q(u) = (-u), c’est-à-dire que la loi est symétrique par rapport 
au centre de distribution O, soit : P(U < —x) = P(U > x), ce qui se traduit pour la f:r. 
par D(—x) = 1 — D(x). 


Figure 3.9 
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De cette symétrie découle également la probabilité d’un intervalle centré à l’origine : 
P(IU] < a) = P(-a <U < a) = D(a) — P(—a) = 2d(a)- l1,a > 0 


Ceci permet par exemple de déterminer l'intervalle interquartile, c’est-à-dire l'intervalle 
centré à l’origine et qui contient 50 % de la masse totale. On doit trouver la valeur de 
a telle que P(IU| < a) = 1/2, soit 2®(a) — 1 = 1/2 ou D(a) = 0,75. Il s’agit donc 
du fractile d’ordre 0,75 de la loi normale standard, dont la valeur est lue dans la table 2 
des fractiles : a = Q;, = 0,6745 = 2/3. Rappelons que le fractile d'ordre p € ]0, 1[ 
est la valeur u, telle que D(,) = p, Soit u, = D-l(p). De même, on peut calculer 
la probabilité P(IU| < a) des intervalles centrés à l’origine, pour les valeurs entières 
de a. Ainsi : 2®(1) — 1 = 0,68268, 2®(2) — 1 = 0,95450, 2(3) — 1 = 0,9973; 
il n’y a pratiquement plus de masse de probabilité au-delà de la valeur 4 puisque : 
P([U| > 4) = 6 x 10. La figure 3.10 ci-après synthétise ces résultats pour une loi 
quelconque, à partir de l’équivalence : 


X—m 


—a < <aSm-cçca<x<m+ca 


E m+20 
—m-36 m-20) m-0! 3 mi; 3  im+o m+26 M+30— 
n 7 50% | | , 
68 % 
iL 95 % ue 
99,7 
Figure 3.10 


Pour déterminer les valeurs de la fr. d’une loi normale quelconque, on se ramène à 
la loi standard qui est tabulée, à partir de : 


FG= P(X < x) = P(ÈP : im) 2 p{u <==") 


=o(") 
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b) Convolution de lois normales 


La convolution (somme) de deux lois normales indépendantes est encore une loi nor- 
male : si X — N(m,6,) et Y + N'(m,,0,) sont des v.a. indépendantes, alors 


A4 N (mm, 20) 


2.4 Loi gamma 


Une va. X suit une loi gamma de paramètres p > 0 et 8 > 0 si c’est une v.a. positive 
dont la densité est de la forme : 


op —0x  p-1 
x)= ——e "x? ,x2>0 
A TG > 


la fonction gamma étant définie pour tout p > 0 par : 
+00 
T(p) = | e *x”-ldx 
0 
On écrit X » y (p,0). Parmi les nombreuses propriétés de la fonction [”, on montre 
en intégrant par parties que pour tout p > 1: 
PG) = DT —1) 
Donc, pour p entier strictement positif on en déduit que : 
TG) = (p— D)! 
Le calcul des moments s’effectue aisément par le changement de variable y = 0x 


108 A ps AE PR Sd AT D 5 
FO ‘ “ass FF 6 co 0 


P 4:00 +00 C 2 1 
E(X?)= S/ e xl qx = S/ era — = (p + 2) = es ) 
TG) Jo TE) Jo 62 62 Ip) ñ 


P 


Étudions la loi de la v.a. Y = 0X : 
G(ÿ) = P(Y < y) = P(OX < y) = P(x < =) _ F(=) 


où Fest la fr. de X ; la densité de Y est obtenue par dérivation : 


et on reconnait la densité d’une loi y (p, 1) que nous noterons simplement y(p). 


Les moments s’obtiennent à partir de ceux de X en faisant 0 = 1 : 


EY)=V(®Y)=p 
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On a donc les équivalences suivantes entre les lois gammas à 1 et 2 paramètres : 


X + 7,0 SY =0X 2 7) 8 X = + = 7(0,0) 


Convolution de lois gammas 


La convolution (somme) de deux lois gammas indépendantes est encore une loi gamma : 
si À » y(p,0)et Y +» 7(q,0) sont des va. indépendantes, alors la v.a. somme 
X+Y » y(p+4,0). 

La famille des lois gammas contient comme cas particuliers deux lois usuelles, l’une 
déjà étudiée qui est la loi exponentielle de paramètre 0 > 0, obtenue pour p = 1 et qui 
est donc la loi 7(1,0) de densité 0e-** pour x > 0. Cette remarque peut être utile en 
statistique dans le cas de v.a. X,,..., X, indépendantes et de même loi exponentielle de 


paramètre 0, avec : 
S, = y X,- 7(n,0) et 065$, y(n) 
i=l 


La seconde est la loi du khi-deux, très utilisée en statistique et que nous allons étudier 
maintenant. 


2.5 Loi du khi-deux 


La loi du khi-deux à n degrés de liberté, notée ee est la loi y(n/2, 1/2) où n est un entier 
positif, donc de densité pour x > 0: 


1 
= —x/2.,.n/2-1 
X) = —— x 
F6) 2/27 (n/2) 
Ses moments se déduisent de ceux de la loi gamma : 
n/2 n/2 
E(x})= = =ne V(}) = =2 
Go RERO 


REMARQUES En appliquant les équivalences ci-dessus entre lois gammas pour 
0 = > on peut passer de la loi gamma non tabulée à la loi du khi-deux qui est tabulée : 


1 1\ _ 
Y=;XorDeX=%-7(r;)=x, 


Pour des v.a. exponentielles comme ci-dessus on en déduit 28,5, 2 


Il existe également un lien avec la loi normale qui explique son importance en 
statistique. Si X - Nm, 0) alors : 


X -m : 2 
Care 
(o} 
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En effet, la v.a. U = (X -— m)/o suit une loi N(0, 1) et si on pose Y = U?, sa fr. est 
définie pour y > 0 par : 
GG) = PE < y) = P(-ÿ/y <U < 4») = En - P(-1») 


et sa densité est donc : 


1 E(Vr) er? 
80 = — [o(y» + vy)] = = 
2V2 y V2ry 
c’est-à-dire, puisque [(1/2) = V7, la densité d’une loi 7(1/2, 1/2) ou loi se 
Ceci permet notamment de retrouver l’expression du moment centré d’ordre quatre 


de la loi normale, puisque de V[(X —m)/o]? = 2 on en déduit par la formule développée 
de la variance E(X — m)* — EX — m)? = 20 puis E(X — m)* = 304. 


Convolution de lois du khi-deux 


La convolution (somme) de deux lois du khi-deux indépendantes est encore une loi du 
khi-deux : si X re et » je sont des v.a. indépendantes alors la v.a. X+Y us 
Il s’agit simplement de la propriété relative aux lois gammas. 

Des deux propriétés précédentes nous allons déduire une autre propriété qui indique 
comment s’introduit cette loi dans les échantillons gaussiens : si X,,..., X, sont des va. 
indépendantes et de même loi N(0, 1), alors X ‘ +..+X ? suit une loi du khi-deux à 
n degrés de liberté. Cette propriété pourrait d’ailleurs servir de définition de cette loi, 
sans référence à la famille des lois gammas. Le nombre de degrés de liberté correspond 
au nombre de variables indépendantes qui sont intervenues dans sa construction ; si ces 
variables étaient liées par k relations, le nombre de degrés de liberté serait alors ñn — k. 


2.6 Loi bêta 


Il existe deux familles de lois bêtas qui se déduisent de la famille des lois gammas. 


a) Loi bêta de seconde espèce 


Si X et YŸ sont deux v.a. indépendantes de lois respectives y(p) et y(q), alors la v.a. 
Z = X/Y suit une loi bêta de seconde espèce de paramètres p > 0 et g > 0, notée 
Br1(p, q), et de densité pour z > 0: 


À a 
TT 
où : 
_ TK) 
RD Too 
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Des propriétés de la fonction L'on déduit aisément les moments de Z': 


De: ue zP ROME p se 
B(p, q) 


(1 + z)r+4 B(p, q) g—1l" 
NES | [ 7 _ B(+2,q-—2) ___ p+1) ; 
Fe B(p, q) (1 + z)P+4 d B(p, q) (g — 1)(q — 2) LES 
p(p + q — 1) 
404 = A AE REC ER 2 
Fimo 7 


b) Loi bêta de première espèce 


La loi bêta de première espèce est également définie par un rapport de lois gammas ou 
à partir de la loi précédente ; c’est celle de la v.a. à valeurs dans [0,1] : 


T = X _ Z 
| X+Y 1+7Z 
sa densité pour 0 < f < 1 est: 
1 
fo = (An! 
B(p, q) 


on écrit T - ff, (p, q). Notons que : 
1 
/ (1-07 "dt = B(p,q) 
0 


On obtient comme moments : 


af ru- pee)». op = 
B(p,q) © B(p,9  p+q 


E(T?)= 1 [ Pl 17 ldt = B(p +2,q) = pp + 1) 
B(p,9) Jo B(p, q) (p + g)(p + q + 1) 


ee es » 
(p + aq) p+q+1) 


2.7 Loi log-normale 


La v.a. positive X suit une loi log-normale de paramètres m et o > 0 si la v.a. InX suit 
une loi N(m, 0); sa f.r. vérifie donc pour x > 0: 


F(x) = P(X < x) = Pin X <Inx) = P 


spé) 


(o} 


nMX-m Inx-m 
en) 
o 
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sa densité est donc pour x > 0: 


10 = p() - 


(o} 


exp 2 (in x — m) 
oxV2x 26 


2.8 Loi de Pareto 


C’est une loi qui est utilisée notamment dans la modélisation de la distribution des 
revenus d’une population ou en théorie des assurances. Sa densité est définie pour 
x > Xo > 0,x, pouvant s’interpréter comme le revenu minimum, en fonction d’un 
paramètre « > D: 


ro=£(2)" 


Compléments : fonctions génératrices 


La notion de fonction génératrice peut être utile parfois pour calculer plus facilement 
les moments de certaines lois de probabilité. 


3.1 Fonction génératrice d'une v.a. discrète positive 


Si X est une v.a. discrète positive dont la loi de probabilité est définie par l’ensemble 
des couples (x,, p,), où k parcourt un ensemble d’indices K € N, on peut définir sur 
[0,1] sa fonction genératrice par : 
GxQ) = EUX) = Ÿ put 
kEK 
Pour 0 < u < 1, la série qui définit G, est uniformément convergente puisque 


u%| < pLetque Ÿ p, = 1. Par ailleurs, G;(0) = 0 et Gy(1) = 1. Un cas parti- 
kEK 


culier intéressant est celui d’une variable à valeurs entières, soit X(Q) = K CN,où Gy 
est définie pour tout u € Ctelque [u| < 1 par : 


GG) = EU*) = Ÿ put 


keK 

Exemple 3.4 

Loi de Dirac (masse en a) : G,{(u) = u“. 

Exemple 3.5 

Loi de Bernoulli : G;(u) = pu + q. 

Exemple 3.6 

Loi binômiale : G,(u) = Y () p*(1 — p}'Kuk = (pu + q)". 
k=0 
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Exemple 3.7 


Loi de Poisson : G;{u) = > e” FU eh, 


Exemple 3.8 
pu 
1-qu 


CO CO 
Loi géométrique : G,(u) = YX pq“ lu* = pu Y (qu)! = 
k=1 k=1 


Il y a une correspondance biunivoque entre loi de probabilité et fonction génératrice, 
due à l’unicité du développement en série entière de Taylor : 


GO à 


Gx{u) = DT = Lo, 


kEN kEN 


ce qui permet d’obtenir par exemple la loi de probabilité à partir de la fonction généra- 


trice, par les relations : 
Gx(0) = po et GŸ(0) = klp, pour k € N* 
Si X,,...,X, sont des v.a. mutuellement indépendantes, alors : 
Gx4.4x, (U) = E(u*it-+4,) _ e(1 x) 
i=l 


II EUX) = II Gx,G) 
i=i i=] 


Exemple 3.9 
La loi binômiale négative de paramètres n et p peut s’écrire comme somme de n lois 
géométriques indépendantes, donc, d’après l’exemple 3.8 : 


ue (2) 


La fonction génératrice est surtout utile pour déterminer les moments factoriels : 


Hg = ELX(X - D... (X-k+1), keN° 


puisqu'on obtient GŸ(u) = D jG - 1)... -k + D) pjulr® et par conséquent 
j=k 


GX (D = 


Exemple 3.10 


Pour la loi de Poisson, G ,(u) = e"*elt donc GŸ(u) = Afe let et puy = ÀŸ. 
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La fonction génératrice des moments factoriels est donc définie par : 
Gy(1 + u) = D Mur 


La fonction génératrice des moments pour une v.a. discrète X est définie par : 


H,Q) = E(e"*) = Gy(e")= Ÿ pre“ 
keK 


uX 


En développant en série entière e“*, on obtient en effet : 


; RE ne u* 
HyG) = Et) = L'REX = Dm 
k=0 k=0 
d’où on déduit m, = E(X*) = HŸ(0) pour k € N”, avec mo = 1. 


Exemple 3.11 
Pour la loi de Bernoulli, Hy(u) = E(e“*) = Gy(e” — pe“ + 1 — p, donc 
HŸ(u) = pe" et m, = p pour tout k € \*. 


3.2 Fonction génératrice d'une loi absolument continue 


La fonction génératrice des moments, pour une v.a. X de densité f, est définie par : 
+00 


H},(u) = E(e“*) = / e"* f(x)dx 


lorsque cette intégrale généralisée existe. 


Exemple 3.12 
Si X -» E(0) : 


+00 
H,(u) = 0 | eU0Xx x = ee pour u < 6. 
0 0 — U 


Pour |u| < 8 on obtient donc : 


1 Qu SE! uk 
Hy{u) = DE x 
1—-u/0 Frs ok rer E  k! 
k! 
donc m, = DE pour tout k EN. 
Si X,,...,X, sont des v.a. mutuellement indépendantes, alors : 


i=1 


= [[£c" = TT Ax 0 
i=l i=1 


H%,4..4x, (0) = E(e“it-#2)) = (1 ) 
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Exemple 3.13 

Dans l’exemple 3.12, on a calculé la fonction génératrice des moments de la loi ex- 
ponentielle de paramètre 0, qui est aussi la loi y(1, 0). En additionnant p variables 
indépendantes de ce type, on obtient la loi 7(p, 0) dont la fonction génératrice est 


1 P 
HO = (7) 


La fonction génératrice des moments centrés est définie par : 


donc : 


MG) = eV" Hx(u) = Ele“X"] 


que l’on détermine à partir du développement en série entière : 


CL ESS) mx — m,)* 
k=0 
pour obtenir : 
Sr” 
My) = D Den 


qui permet de déduire les moments centrés à partir de cette fonction par : 


y = E(X - m) = MY (0) 


Exemple 3.14 


Pour la loi exponentielle de paramètre 0 on a m, = 1/8 et donc : 


È 1 SCO) su) 
M,y{u) = e "0 x x (5) 
1—u/06 D k! 2 0 
L Cr) (—1)f u j+k 
2 k! x(5) 
=2 j=0 
Sn (1 u' 
DE k! n! 


On obtient ainsi : 
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L'essentiel @ 


Le choix de la loi à retenir pour modéliser un phénomène réel peut paraître dé- : 
licat compte tenu du grand nombre de lois usuelles. Cependant, on peut savoir : 
sans ambiguïté s'il s'agit d'un phénomène discret ou continu. Dans le cas dis- 
cret, il faut bien noter les conditions précises de l'expérience conduisant à telle 
ou telle loi. Dans le cas continu, on peut aussi savoir sans ambiguïté s'il s'agit de 
valeurs finies ou non, qui peuvent être éventuellement négatives ou non, d'un 
phénomène qui est de nature symétrique ou non. Enfin, l'expérience permet de 
savoir que certains types de lois sont particulièrement adaptés à certains phé- : 
nomènes (exemple loi exponentielle pour les modèles de durée de vie ou loi de 
Pareto pour les modèles de distribution de revenus dans une population). È 


LECEPEELELECEC EC EEE LEE EEE EEE) CCELELEC ELEC ELEC EC EE EEE CEE EE EEE EEE EEE EEE EEE EEE EE CETELELELEELELELEC EEE CEE ETS CETECELELLELECECEC EEE 
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(@) Entrainez-vous 


3.1 


3.2 


3.3 


3.4 


3.5 


3.6 


3.7 


1. Vous effectuez un voyage en avion à bord d’un biréacteur qui peut poursuivre son vol 
avec un seul réacteur qui fonctionne. Les réacteurs fonctionnent de façon indépendante 
et ont chacun une probabilité p de tomber en panne au cours du vol. Calculer en fonction 
de p la probabilité x} que votre vol ait pu se poursuivre jusqu’à sa destination. 


2. Dans le cas d’un quadriréacteur, qui peut poursuivre son vol avec au moins deux 
réacteurs qui fonctionnent, calculer en fonction de p la probabilité 7, que votre vol ait 
pu se poursuivre jusqu’à sa destination. 


3. Pour quelles valeurs de p le biréacteur est-il plus sûr que le quadriréacteur ? Calculer 
Zp€tXo POUr p — :- 


Au casino, un joueur décide de miser sur un même numéro (ou série de numéros), jus- 
qu’à ce qu’il gagne. Sa mise initiale est a > 0, le numéro qu’il joue a la probabilité 
p de sortir à chaque partie et il rapporte k fois la mise, k € N*. Calculer l’espérance 
mathématique du gain G de ce joueur qui double sa mise à chaque partie. 


Une urne contient une boule blanche et une boule noire. 


1. On effectue des tirages avec remise jusqu’à obtention d’une boule blanche. Détermi- 
ner la loi de probabilité du nombre N de tirages, puis calculer E(N) et V(N). 


2. Mêmes questions si on remet une boule noire en plus après chaque tirage d’une boule 
noire. Calculer alors P(N > n),n € N*. 


Vous avez besoin d’une personne pour vous aider à déménager. Quand vous téléphonez 
à un ami, il y a une chance sur quatre qu’il accepte. Soit X la variable aléatoire qui repré- 
sente le nombre d’amis que vous devrez contacter pour obtenir cette aide. Déterminer 
la loi de probabilité de X puis calculer P(X < 3) et E(X). 


Lors d’un examen oral, on vous demande de tirer les trois sujets que vous aurez à 
traiter dans une urne qui en contient dix. Parmi ces dix sujets, il y en a 3 que vous ne 
connaissez pas. Soit X la variable aléatoire qui représente le nombre de sujets qui vous 
seront inconnus à l’issue de ce tirage. Calculer les probabilités des différentes valeurs 
possibles de X et en déduire E(X). 


Pour être sélectionné aux Jeux olympiques, un athlète doit réussir deux fois à dépasser 
les minima fixés par sa fédération. Il a une chance sur trois de réussir à chaque épreuve à 
laquelle il participe. On note X la variable aléatoire qui représente le nombre d’épreuves 
auxquelles il devra participer pour être sélectionné. 

1. Déterminer la loi de probabilite de X. 


2. Si cet athlète ne peut participer qu’à quatre épreuves maximum, quelle est la 
probabilite qu’il soit sélectionné ? 
Soit X une v.a. de loi binômiale de paramètres n = 20 et p = 0,1. 


1. Calculer les probabilités suivantes : P(X = 5), P(X < 2), P(X < 4), P(X = 1,5), 
PG<X<4)et P2<X<S3). 


© Dunod — Toute reproduction non autorisée est un délit. 


3.8 


3.9 


3.10 


3.11 


3.12 


3.13 


3.14 


3.15 


3.16 


3.17 


Lois usuelles 


2. Déterminer les valeurs de x telles que P(X > x) < 0,75. 
3. Calculer P(X = 16) dans le cas ou p = 0, 9. 


Si X est une v.a. de loi de Poisson de paramètre À = 5, calculer les probabilités 
P(X = 6), P(X < 4), P(X > 5)et P(x/2 < X < 2x) puis déterminer les valeurs de 
x telles que P(X < x) > 0,95. 


Un commentateur sportif affirmait que le gain du match de double en coupe Davis 
(événement noté D), était généralement synonyme de victoire. Le pays gagnant est 
celui qui remporte le plus de matchs, la rencontre comportant 4 matchs en simple et 
un match en double. On fait l’hypothèse que pour ces 5 matchs chaque pays a la même 
probabilité de l’emporter. Déterminer la loi de probabilité de la v.a. X qui représente le 
nombre de matchs gagnés par une équipe. En déduire la probabilité que le pays gagnant 
ait effectivement remporté le match de double. Calculer alors la probabilité qu’un pays 
ait remporté le match de double, sachant qu’il a gagné. Que penser de l’affirmation de 
ce commentateur ? 


Si U est une v.a. de loi normale standard, calculer P(U < —2), P(-1 < U < 0,5)et 
P(4U > —3) puis déterminer u, et v, tels que P(IU] < up) = 0,82 et P(U < —v5) = 
0,61. 

Soit X une v.a. de loi normale telle que P(X < 3) = 0,1587 et P(X > 12) = 0,0228. 
Calculer P(1 < X < 10). 

Si X est une v.a. de loi normale telle que P(X < 2) = 0,0668 et P(X > 12) = 0, 1587 
calculer la valeur de a telle que P{[X — EXP < a} = 0,95. 

Une v.a. X suit une loi uniforme dans l’intervalle [0,1]. 

Exprimer la probabilité que X appartienne à l’intervalle [x;, x,] en fonction des réels 
x, et x, tels que x; < x2. 


Soit X une variable aléatoire dont la densité a pour expression, pour x > 0: 


1 (In x)? 


Exp — 
xV2x0 20 


Déterminer la loi de probabilité de la variable aléatoire Y = In X. 


F@) = 


Déterminer la f.r., puis calculer l’espérance et la variance, d’une v.a. qui suit une loi de 
de: DE 
Laplace de densité f(x) = 3e". 


Si T est une v.a. positive représentant une durée de vie, on dit qu’elle vérifie la propriété 
de non-vieillissement si pour tout f > 0 et h > 0: 


PT>t+hT>1)=P(T>h) 
Montrer que la loi de Pascal et la loi exponentielle de paramètre 9 > 0 vérifient cette 
propriété, c’est-à-dire sont des lois sans mémoire. 
Si F et f sont respectivement la f:r. et la densité d’une v.a. positive, on désigne par 


taux de panne la fonction À définie pour x > 0 par : 


__ fo 
IE 
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3.18 
3.19 


3.20 


Déterminer cette fonction À pour la loi exponentielle de paramètre 0 > 0 et pour la 
loi de Weibull de densité f(x) = a0x®=lexp(—0x®) pour x > 0, où « et 0 sont deux 
paramètres positifs. 

Calculer l’espérance et la variance d’une loi log-normale de paramètres m et o > 0. 
Soit X,,..., X, des v.a. indépendantes de densité fet de f.r. F. Déterminer les f.r. puis 
les densités des v.a. m, = min {X;/1<i<n}etM,=max{X;/1<i<n}. 
Appliquer ce résultat au cas particulier de la loi uniforme sur [0,1], puis calculer dans 
ce cas E(m,) et E(M,). 

Déterminer les moments non centrés d’ordre k,k € N*, de la loi de Pareto de 
paramètres « > 0 et xo > 0. 
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3.2 


3.3 


Solutions © 


1. On note P, l’événement « le réacteur À est tombé en panne au cours du vol », avec 
i = 1,2. On obtient : 


ly=P(PNP) =1-P(PNP)=1-p 
2. Le nombre de réacteurs qui tombent en panne au cours du vol est une variable 
aléatoire X qui suit une loi binômiale de paramètres 4 et p. Ainsi : 

Zo = PIX <2)=1-— P(X =3)- P(X =4)=1—4p(1-p)-p" 
= 1-4p + 3p+ 
3. On obtient : 
70 — %g = (1 pXI —3p) 

donc le biréacteur est plus sur que le quadriréacteur pour p > 1/3. 


vif 1\ 12 1\ 11 
On véri eque 5 (;) ST > ro (3) mé 


Si N est le nombre de parties jouées, l’événement {N = n},n € N*, signifie que le 
joueur a perdu les n — 1 premières parties et que son numéro est sorti à la dernière ; 
cette v.a. suit donc une loi de Pascal de paramètre p : 


P(N =n)=(1-p}" lp 


À l'issue de ces n parties, le joueur reçoit k fois sa mise, soit k2n-1 à, après avoir misé 
au cours de ces parties : a + 2a + 22a +... +2"-la = a(1+2+22 +... +270 = 
a(2" — 1). Son gain est alors : g, = k2"-la — (2" — 1)a = a+(k—2)2"" la. 


L’espérance de gain est donc : 


E(G) = >, g, P(N =n) = a+(k-2)ap > A R à Le 


n=] n=1 


= a+(k-2)ap À (2q)"! 


n=1 

où on a posé q = 1 —p. Si q > 1/2, la série est divergente et cette espérance est infinie. 
Si g < 1/2, c’est-à-dire p > 1/2, on obtient : 

P kp—1 

= a 

1—-2q 2p-1 
Pour k = 2 par exemple, E(G) = a, c’est-à-dire que l’espérance de gain du joueur est 
égale à sa mise initiale. 


E(G) = a+(k—2)a 


1. Les tirages sont effectués jusqu’à ce que l’on obtienne une boule blanche, donc la 
variable N suit une loi de Pascal de paramètre p = 1/2 puisque c’est la probabilité de 
tirer une boule blanche : 


1 


D’après les résultats du cours : E(N) = V(N) = 2. 
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2. Si on note respectivement B, et N; les événements tirer une boule blanche et tirer 
une boule noire au i-ème tirage, i € N*, la loi de la variable entière N est définie par : 


PIN = 1)= P(B)= > 
PN =2)= PNB) = 3 X 3 


n—] 1 1 
n n+1l nn+1) 


P(N =n)= P(N;,..N,_ 1B) = 3 X 3 X 2 X 


Ainsi : 


CO se) 
1 1 1 
E(N)=;+ÿn =Y- 
6) n(n +1) Don 
série harmonique divergente, donc l’espérance est infinie. À fortiori la variance n’existe 


pas non plus. 
On obtient : 


PIN >n)=1-P(N<m=1-Y P(N=Kk) 
k=1 


1 1 
DS > (&- =) 
3.4 La v. a. X suit une loi géométrique (de Pascal) ; pour tout entier k > 1 


3k-1 


P(X = k) = FT 


On obtient ensuite : 
3 
37 
P(X < 3) = P(X = k) = — 
(Œ<S) D X=D=T 


Le paramètre de cette loi est 1/4 donc E(X) = 


3.5 La v. a. X suit une loi hypergéométrique ; pour tout entier 0 < k < 3: 


CIE, 


10 
3 
On obtient ensuite : 


PX=0)= 2 PX=D= > P(X = 2)= € P(X =3) = — 


P(X = k)= 


3 1 
E(X 12 
ie ne ’ 


En utilisant la formule du cours on retrouve E(X) = 3 10 = 1,2. 
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3.6 


3.7 


3.8 


3.9 


Lois usuelles 


1. Il s’agit de la loi binômiale négative ; pour tout entier k > 2 


FREE D 


2. La probabilité d’être sélectionné est 


P(X < 4) = S rx = k) = 
k=2 
1. Par lecture de la table 3 on obtient : P(X = 
0,6769, P(X < 4) = 0,8670, P(X = 1,5) = O, 
P(2 < X < 8) = 0,9999 — 0, 6769 = 0, 3230. 
2. La condition P(X < x) > 0,25 équivalente à P(X < x — 1) > 0,25 conduit à 
x—1>loux2>2. 


0319, P(X < 2) = 


5) = 0, 
PG < X < 4) = 0,2799 et 


3. Si X + B(n,p) on a PUX = x) = o (1 = get PIX = n— x) = 


u " ) p'*(A — p}* = (") p'(1 — p}"* où on a pousé g = 1 — p. Par consé- 
quent P,(X = x) = P;_,(X = n — x), soit en appliquant ce résultat : P69(X = 16) = 
Par lecture de la table 4 on obtient : P(X = 6) = 0,1462, P(X < 4) = 0,2650, 
P(X > 5) =0,5595 et P(x/2 < X < 2x) = P(X < 6) — P(X < 1) = 0,7218. On lit 
P(X < 10) = 0,9682 donc x > 10. 

La v.a. X suit une loi binômiale de paramètres 5 et 1/2. Un pays est gagnant si X > 3; 
la probabilite demandée est donc : 


5 5 
P{DN(X>3)}= Ÿ P(DN(X=k)}= À P(X = H)P{DIX =k) 
k=3 k=3 
Si un pays à gagné k matchs, tous les choix parmi les cinq rencontres sont équipro- 


bables, donc : 
4 
k—1 


(o) 


P{DIX =k}= 
Ainsi : 
PLDOX >=) = 


On en déduit : 
P{Dn(X >3)}_ 11/2 ul 
P(X>3) 1/2 16 


P{DIG} = 
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L’affirmation de ce commentateur paraît fondée puisque cette probabilite est supérieure 
à 1/2. Cependant, s’il affirmait que le gain du premier match en coupe Davis est géné- 
ralement synonyme de victoire on obtiendrait la même probabilité. C’est le fait d’avoir 
emporté un match (quel qu’il soit) qui renforce évidemment la probabilité de gagner ! 


Par lecture des tables 1 et 2 on obtient P(U <—2) = 1 — (2) 0,0228, 
P(-1<U <0,5) = (0,5) — [1 — D((1)] = 0,6915 — 0,1587 = 0,5328, 
PAU > —3) = 1 — D(-0,75) = D(0, 75) = 0, 7734; 

P(IU] < u5) = Duo) — P(-u0) = 2P(u9) — 1 = 0, 82 d'ou P(ug) = 0,91 

et ug = 1,3408; P(U < —v0) = D(—v9) = 0, 61 et vy = —0,2793. 

Nous allons d’abord déterminer les valeurs de m = E(X) et co = V(X). La 
premiere valeur étant inférieure à 0,5 on considère son complément à 1, soit ici 
1—0,1587 = 0,8413, valeur dans la table 1 de (1). De même 1 —0,0228 = 0,9772 = 
(2). En centrant et réduisant on a donc : 


P(— < ") = 1— (1) = D(-1) 


P 


(Eee) 00 


soit : 


ce qui conduit à m = 6 et o = 3, puis : 
5 X-6 4 
P(-= < —— < =) 
3 3 3 
= (1,33) — [1 — D(1,67)] = 0, 8607. 


P(I < X < 10) = 


Dans la table 1 on constate que 1—0,0668 = 0,9332 = (1,5) donc P(X < 2) = 
®(—1,5); de même 1—0,1587 = 0,8413 = (1). Donc en centrant sur E (X) = met 
réduisant par /V(X) = 0 : 


—m 


—*) = d(—1,5) 


#2 
#2 


12 — 


soit 2m = —],5et 


= 1 d’où m = 8 et o = 4. On sait que la v.a. 


ie 
(= “) suit une loi fe donc a/o? est le fractile d’ordre 0,95 de cette loi Le lu 
ô 


dans la table 5, soit a/o? = 3,841 et a = 61,44. 


Si. f est la densité de cette loi uniforme, cette probabilité se calcule par : 


*X2 
p=PIXElx;,x1} a, f@Odt 


X] 
La densité a pour valeur 1 dans l’intervalle [0,1] et 0 en dehors. La valeur de p est 
donc égale à la longueur de la partie commune des intervalles [0,1] et [x,, x]. Elle est 
indiquée dans le tableau suivant, en fonction de la position de x, et x; : 
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X)<0 | x <0<x <1 | x <0O<1<x) | O < xy < x2 <1 | O<xy <1<x2 | 1< x, 


0 X2 1 X2 — X1 1— x 0 


3.14 La va. Y a pour fonction de répartition : 
G{y) = P(InX < y) = P(X <e?) = F(e) 


où Fest la fr. de X. La densité obtenue par dérivation est : 


y? 


1 
Exp —— 
V2x0 20 


qui est la densité de la loi normale centrée de variance 0. 


g(y) = e” f(e”) = 


3.15 Lafr. de la loi de Laplace est définie pour x < 0 par : 
F(x) = L | e'dt = Lz 
2j 2 


CO 


et pour x > O par: 


FO = FO+3 fe t=i+itehi=1-3e 
E 2 Jo 1218 0 2 


L’espérance est définie par l'intégrale généralisée : 


+00 
E(X) = :/ xe-lax 


CO 
qui est convergence d’après le théorème des croissances comparées ; sa valeur est donc 
nulle puisque la fonction à intégrer sur R est impaire : la loi est symétrique et E(X) = 0. 
La variance se calcule en intégrant deux fois par parties : 


1 +oo +00 
VOD = EX) = > | x2e-Plax = | sas 
— co 0 


+00 ee HS +co 
= [7e + 2 xe *dx =2 [-xe”* 0 € 2) e *dx =2 
0 0 


3.16 Pour la loi de Pascal on a pour f € N: 


CO Lee] Lee] t 
: pq 
PT>0= Z PT=b=p X d'=p Da = =4 
k=t+1 k=t+1 k=0 —4q 


Par conséquent, pour h e N: 

P{T>t+h)NnT>n} PT>t+h) 
P(T >5) 7 PT>n 

=g" = P(T > h) 


P(T>t+hIT > 1) = 


ce qui établit que c’est une loi sans mémoire. 


Pour la loi exponentielle de paramètre 0, on a pour f > 0: 


+0 
P(T > ft) = / 0e *dx = [ex] = et 
t 
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d’où pour h > 0: 
PT>t+h —bG+h) 
PT>t+hr>n= 27 t+h) _e =e th = p(T>h) 
P(T >f) er0t 


ce qui prouve la propriété de non-vieillissement. 


La fr. de la loi exponentielle vérifie 1—F(x) = e—0x pour x > 0, donc: 
Qe-°x 
h(x) = — = 0 


la loi exponentielle est à taux de panne constant, en plus d’être sans mémoire comme 
nous l’avons vu dans l’exercice précédent. 
Pour la loi de Weibull, si x > 0: 


ke " 
F(x) = F agi" le dt = [— exp(—0r")fù = 1 — exp(—0x") 
0 
et : 
h(x) = «0x! 


on retrouve bien le résultat obtenu pour la loi exponentielle en faisant a = 1. 


On calcule l’espérance de X de loi log-normale de paramètres m et © en faisant le 
changement de variable y = Inx : 


1 +00 1 ) 
E(X) = exp ——(In x — m) dx 
oV2x /0 26 
1 +00 ” 1 ; 
= € exp——(y - m)dy 
oV2x / -œ 20? 
1 Fe 1 
= / EXP —— y? — 2m + o°)y + m°| dy 
oV2x / -c 26 
= exp À 2 [om +08] fes l Ly-0m + 02] a) 
oV?2x 202 2 202 


: exp { — Qmo? + “} oV2x = exp(m + o?/2) 
oV2x 26 


On obtient de la même façon : 
ECX2) = exp(2m + 202) et V(X) = (e°° — 1)exp(2m + 0?) 


Pour déterminer la f.r. de m,, on considère l’événement : 


De même, pour que M, soit inférieur à z il faut et il suffit que tous les X; soient inférieurs 
à z, ce qui s'écrit : 


(M, <a} = (x <2) 
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On en déduit, du fait de l’indépendance des X; et de l’identité de leur loi : 


G0)= rm en= tr {(jx>n } ein -ror 
i=1 


H(2) = PCM, < 2)= | [PCX; < 2 = F"@ 
i=1 


Les densités correspondantes s’obtiennent par dérivation : 


80) = nfOU - FO! 
h(z) = nf(2)F"T (2) 


Dans le cas particulier de la loi uniforme sur [0,1], on obtient : 


GH=1-(A-y)" et gm=n1-»"l, 0<y<i 
H(z)=72" et h(z)=nz"!,0<z<1 


On calcule alors l’espérance : 


1 1 
Em) =n | y pays | (A — uju" du 
0 0 


d 1 
=" / dtau-n | iinate ee 1 
0 0 n+l n+l 


obtenue en faisant le changement de variable u = 1 — y. De même : 


1 
ECM) = n | Er 


Remarquons ici que : 
GP = P(m, <y)=1-H(-y=PM,> 1-7 =P(-M,<)y) 
ce qui montre que les va. m, et 1 — M, ont la même loi de probabilité et donc que 
E(m,) = 1 - E(M,). 
Le moment non centré d’ordre k de la loi de Pareto de paramètres a et x, est : 
+00 xk-a + ; 
E(X*) = xs / ak gx = axt | | = : 


——— x 
0 = = 0 
; k—a # a—k 


à condition que k < a. Seuls existent les moments d’ordre inférieur à «. Par exemple, 
pour « = 2, la loi admet une espérance mais pas de variance. Pour à > 2, on obtient : 
a 2 


"PT a-ve- np" 
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Chapitre Œ 
Couple et vecteur 


aléatoires 
A introduction ES | 


? Comme nous avons associé un nombre à une expérience aléatoire, dans certains cas nous 
pouvons être amenés à en associer plusieurs. Par exemple, le jet de deux dés distincts 
ne peut pas être codé avec une seule valeur numérique. De même, à un individu d'une 
È population donnée, on peut associer son revenu et sa consommation. On est alors amené à 
associer à de telles épreuves aléatoires deux, voire plusieurs valeurs numériques, au moyen 
donc de plusieurs applications qui seront des v.a. pouvant être regroupées dans un vecteur, 
ce qui conduit à la généralisation en multidimensionnel de la notion de variable aléatoire 
réelle : un vecteur aléatoire. Pour la commodité de l'exposé nous commencerons par 


étudier le cas bidimensionnel, celui d'un couple aléatoire, en distinguant toujours les cas 
discret et continu. Nous verrons ensuite comment se généralisent les moments associés  : 
à un vecteur aléatoire et présenterons deux lois particulières, la loi multinomiale et la loi 
normale vectorielle. 


2" Objectifs PE Concepts clés | TEE LE : 


. 


! (QMÉIES les notions de variable  } Loi marginale et loi conditionnelle  : 

| aléatoire, d'espérance et de variance î }  Régression E 

E au cas multidimensionnel. ARR : E 

: ; Covariance | 

: Ein les lois conditionnelles, la fonction : Indépendance E 

Ë de régression et la convolution de deux : : | : : Ë 
: : Matrice de variances/covariances 


L lois. 


@ Couple de v.a. discrètes 


1.1 Loi d'un couple 


Un couple de v.a. discrètes est constitué de deux v.a. discrètes X et Y dont l’ensemble des 
valeurs possibles peut s’écrire respectivement sous la forme tu) rt { }; de > Où Jet 
J sont des ensembles d’indices inclus dans N, pouvant d’ailleurs être N tout entier. On 
convient de ne faire figurer que des valeurs de probabilité strictement positive. Comme 
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dans le cas unidimensionnel, la loi d’un couple discret est définie par l’ensemble des 
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valeurs possibles, soit ici és y) :(i,j) € I 'X J}, et par les probabilités associées : 


Pi = Pan (X=x;Y =y;) 


1.2 Lois marginales 


A la loi d’un couple sont associées deux lois marginales qui sont les lois de chacun des 
éléments du couple pris séparément, définies par l’ensemble des valeurs possibles et les 
probabilités associées obtenues par sommation, soit : 


Py (X = Ÿ Pen(X Sr Da 


jes jeJ 
Py (Y = y) = Ÿ Pyn(X sr) = > Py =P; 
iel iel 


Si la loi du couple est présentée dans un tableau, ces lois sont obtenues dans les 
marges, par sommation de ligne ou de colonne. 


Y : M 
Ÿ d 
Pi — 1 


1.3 Lois conditionnelles 


On peut également associer deux lois conditionnelles à la loi d’un couple, c’est-à-dire 
la loi d’une variable, l’autre ayant une valeur fixée (loi dans une ligne ou dans une 
colonne donnée). Par exemple, pour Y = y; fixé, la loi conditionnelle de X est définie 
par l’ensemble des valeurs possibles et les probabilités associées : 


P(X x T=p) Pi 
PT =») Pj 
on vérifie que c’est bien une loi de eur sur D, ={x;iel}: 


DE D; = 


iel Dj iel 


P(X=x;|Y =7;)= 


Exemple 4.1 


La loi d’un couple (X, Y) est donnée par le tableau suivant : 


rl dd 2 
1 |ot 02 01|02 
2 [02 0,2 o0,2|06 

03 04 03|1 
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La loi conditionnelle de X pour Y = —1 figure dans le tableau ci-après : 


XiV= Et: 22 LE, 25 


Rappelons que les deux v. a. X et Y sont indépendantes si pour tout i € I et tout 
je: 


PLR=R Te» )er(X=K)PTE= y) 


Dans ce cas, bien entendu, les lois conditionnelles sont confondues avec les lois 
marginales ; par exemple : 


PJ 


— Pi. 


L 


C’est l’un des seuls cas où la donnée des lois marginales permet de reconstituer la loi 
du couple. 


1.4 Moments conditionnels 
Aux lois conditionnelles sont associés des moments conditionnels, comme par exemple 
l'espérance conditionnelle de Y pour X = x; fixé, qui est l’espérance de la loi définie 
par les couples { (.r) je k soit : 
E (YIX = %) = Dre (Y = APS = x;) : D72 
jeJ jeJ 


Le graphe de cette espérance conditionnelle en fonction de x; s’appelle courbe de 
régression (non linéaire) de Y en X. 


Exemple 4.2 


Dans l’exemple 4.1 précédent, la loi conditionnelle de Y pour X = 2 est donnée par 
le tableau suivant : 


YIX=2| -1 2 


On peut calculer, à partir de ce tableau, l’espérance conditionnelle : 
2 
3 


EŒIX=2=(-Dx3+2% = 1 
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Notons que E(Y]|X) est une fonction de X, donc une variable aléatoire discrète 
dont la loi de probabilité est définie par l’ensemble des valeurs possibles, soit ici 
{E (YIX = x;) 1€ I}, et les probabilités associées p, = P(X = x;). On peut donc 
calculer la valeur moyenne de cette v.a., soit : 


E[E(YIXN=Ÿ p;E (YIX = x;) 


iel 


=Yn y r,P(T=7IX=%x) 


iel jeJ 


=D >, ZE | = >», Dr; 


iel jeJ iel jeJ Pi. jeJ iel 


= D P jy; 
jeJ 
=E(Y) 
On peut également calculer la variance conditionnelle : 


V (YIX = x) = E{(Y-E1x = x;] 1X = x} 
= E(Y\X=x;)-E(YIX=x;,) 


= = 2 b,-E(rIX = x)" 


On peut établir que la variance totale de Y peut se décomposer à l’aide de ces deux 
premiers moments conditionnels : 


V @)=EIVYIMI+VIE(TIX)] 


1.5 Moments associés à un couple 


Sih : R? — R est une application continue, elle définit une variable aléatoire réelle 
dont on peut calculer les moments, comme par exemple l’espérance : 


E[R(X,Y} = Y Ypyh(x.y;) 
ieI je] 
Dans le cas particulier où A(X,Y) = [X — E(X)J[Y — E(Y)] on définit ainsi la 
covariance de X et Y : 


Cov(X,Y)= E{IX -E(X)IY -E(Y)]} = E(XY)-E(X)E(Y) 


Nous avons vu dans le chap. 2, 1.4, 2 que si les va. X et Y sont indépendantes, 
alors E(XY) = E(X)E(Y) et par conséquent Cov(X, Y) = 0. Cependant, il faut faire 
attention au fait que la réciproque est en général fausse, c’est-à-dire que si la covariance 
de deux v.a. est nulle, elles ne sont pas forcément indépendantes. 
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Exemple 4.3 


Considérons le couple (X, Y) dont la loi est définie par le tableau ci-après : 


Les lois de X et Y sont symétriques par rapport à 0, donc E(X) = E(Y) =0et: 


Cou(X,Y)= E(XY)=1X E+(-DX SH CDX EH IX ES = 0 


et cependant ces deux variables ne sont pas indépendantes puisque par exemple : 


P(X=-1,Y =-1)=1/8# P(X =-1)P(Y =-1)=5/16 x 3/8. 


On appelle coefficient de corrélation linéaire de deux v.a. X et Y le nombre réel : 


Cov(X,Ÿ) 


VV OO) Vr () 


p = Corr(X,Y) = 


c’est un nombre tel que —1 < p & 1, avec: 
lPl=l1é& 4aER*,ER: Y=aX+b 


c’est-à-dire qu’un coefficient de corrélation de valeur absolue égale à un est l’indication 
d’une liaison affine entre les deux variables. 


1.6 Loi d'une somme 


Si X et YŸ sont deux va. discrètes de lois respectives (2) NA 1} 
et{ (y; q;) ;,j € ‘he la va. Z = X + Y est aussi une v.a. discrète dont la loi de probabi- 
lité est définie par l’ensemble des valeurs possibles, soit ici{ (x; +y <) 1€l,jeJ } 
et les probabilités associées : 


P(Z =2;,) SD (P(XER Try) /xty 0) 


Dans le cas général cette loi ne peut donc être définie que par la donnée de la loi du 
couple (X,Y). 


Cas particulier X et Y sont indépendantes. 
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On parle alors de convolution des lois de X et Y, qui est définie par : 


ne 
= >P(Y=r)P(X=2-7)) 


En général, beaucoup des termes des sommations précédentes sont nuls car il faut 


tenir compte des restrictions z,—x, € Qy = {y;5i € J} etz;-y;, E Qx = Li (= 1% 


Exemple 4.4 
Convolution de deux lois binômiales. 


Soit X et Y deux v.a. indépendantes, de lois respectives B(n,, p) et B(n;, p). La va. 
S = X +Y est à valeurs dans ©, = {0, 1,...,n, +m} avec pour s € €, : 


(S=s)= [A =0nœ=s-x) 


x=0 
Ainsi : 


P(S=s)=) P(X=x)P(Y =5s-x) 
x=0 


s 
> () pan ( m Pa 
Per X $S — X 
s 
= pts > ni Le — ni + M parte 
<=0 X $ — X S 


ce qui indique que S = X + Y suit une loi binômiale B(n, + n;, p). Le résultat : 


2()CE)- (2) 


exprime que le nombre de sous-ensembles de s éléments extraits d’un ensemble com- 
portant n, éléments d’une sorte et n, éléments d’une autre est obtenu à partir des 


sous-ensembles associés de x éléments de la première sorte et de s — x éléments de 
l’autre, avec x variant de O à s (voir figure 4.1). 


Figure 4.1 
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Nous allons établir maintenant que la loi d’une variable conditionnellement à une 
valeur fixée de la somme est une loi hypergéométrique. La loi de X, conditionnelle- 
ment à S = s par exemple, est définie pour x € {0, Los ni} par : 


P(X=x)P(S=Ss|X = x) 


P(X = x|S = s) = P(S=5) 


_ PASHPT=S-S 
… P(S=Ss) 


é Dai ( m jar 
X S — X 
é 0 psq"its 


Exemple 4.5 

Convolution de lois de Poisson 

Si X et Ÿ sont deux v.a. indépendantes de lois de Poisson respectives P(1) et P (y), 
alors Z = X + Y est une v.a. à valeurs dans N, avec pour tout entier k : 


P(Z =k)= D P(X=x)PY=y=Ù P(X=x)P(Y=k-x) 


x+y=k XxEN 

k k x x 
= FENTE _ SAT = 
DATE 2 Es 

k 

e- +4) k! un  e-H : 

= ———— = — }* X — À + 
kil LG 7 Re WE) 


On retrouve bien comme résultat : 


X+YP(+ ph). 


111 


Statistique et probabilités 


© Couple de v.a. continues 


2.1 Loi du couple 


Si X et Y sont deux v.a. réelles continues, la loi de probabilité du couple (X, Y) est 
déterminée par sa fonction de répartition F, définie sur R? par : 


F(x,y)=P(X <x,Y < y) 


La valeur F(x, y) représente la probabilité de la zone hachurée indiquée dans la 


07 


Figure 4.2 


My) 


X 


L'application F est croissante au sens large par rapport à chacune des deux variables 
et telle que O0 < F(x, y) < 1, avec pour valeurs limites F(—co, y) = F(x, —-co) = 0 pour 
tout x réel et pour tout y réel, et F(+oo,+oo) = 1. 

Si F est deux fois dérivable par rapport aux deux variables, alors la loi de (X°, Y) est 
dite absolument continue, de densité f définie par : 

OF (x, y) 


F (x, y) = 0x0y 


La fonction de répartition se calcule alors par intégration : 


x Ÿ 
F(x, y) = | / f (u, v) dudv 
Exemple 4.6 


La loi de (X, Y) est définie par la densité : 


e* si O<x<y 


fans . sinon 
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Les valeurs de la fr. F vont être déterminées selon la zone d’appartenance du point 
(Xos Jo), en intégrant la densité f sur l’intersection du domaine où elle est non nulle 
avec la partie du plan à gauche et au-dessous du point (voir figure 4.3). On obtient 
de façon évidente : 


? 
Pas 
Yo Î 
0] xx Yo * ra 


Figure 4.3 


Si maintenant le point (Xo, Yo) est dans la zone où la densité f est strictement positive, 
soit 0 < x5 < Jo: 


*o__fYo X=X9 Y=Y0 
F (xo 0) = | Î f (x, y) dxdy = / , (/ ca) dx 
© 00 Xx= Y=Xx 


= ’. ‘ [-e””] en dx = | | (e*—e *)dx = [-e*], — Xpe 
0 0 


X0 


=1-e "0 - xje 7 


Enfin, si 0 < yo < X,, on peut voir sur la figure 4.3 que : 
F (x1, Yo) =F (Yo Yo) = 1—e 0 — yje 0 


En résumé : 


0 si x<O0 ou y<0 
F(x,y)=41-e*-xeY S 0<x< y 
1—-e—-ye? si 0<y<x 
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Comme dans cet exemple, la densité se présente souvent sous la forme suivante : 
.… Si (x, y) € D 
F@y)= : 
0 six» éD 


c’est-à-dire que la densité est non nulle seulement à l’intérieur d’un certain domaine D. 
L'expression de la f.r. du couple (X, Y) se détermine alors en déplaçant le point M(x, y) 
du bas à gauche vers le haut à droite, conformément à la figure 4.4 ci-après. 


My) 


Figure 4.4 


Lorsque l’on quitte le domaine sur l’horizontale de M (même ordonnée) ou sur la 
verticale de M (même abscisse), la valeur de F en ces points extérieurs à D est la même 
qu’au point d’intersection de l’horizontale ou de la verticale avec la frontière de D. 


2.2 Lois marginales 


Les fonctions de répartition marginales de X et Y sont définies à partir de la fr. du 
couple par : 


Fy (x) = P(X < x) = F(x, +00) 
FyOo) = P(Y < y) = F(+c, y) 


c’est-à-dire en faisant tendre y, respectivement x, vers plus l'infini. Dans le cas d’une 
loi absolument continue, les densités marginales sont alors obtenues par dérivation de 
ces f.r. marginales. 

Cependant, si la loi du couple est définie par sa densité, les densités marginales sont 
obtenues plutôt par intégration : 


+00 
f@= | FC »y)dy 
+00 


frO)= f (x, y)dx 


— CO 
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Exemple 4.7 


Si nous reprenons la loi de l’exemple 4.6 précédent, en faisant tendre y vers plus 
l'infini dans l’expression de F, on obtient : 


F4 (x) = F(x, +oo) = 1 —-e* pour x > 0 


et par dérivation : f(x) = e* pour x > 0, densité de la loi exponentielle ou y (1). 


Cette densité peut également être obtenue par intégration de la densité du couple, 
pour x > 0: 


noœ= [rene feaeter ze 
La f.r. de Y s’obtient à partir de F en faisant tendre x vers plus l’infini : 
F;(y) = F(+o, y) = 1 —e* — ye * pour y > 0 
d’où par dérivation, pour y > 0 : fy(y) = ye”? qui est la densité de la loi y (2). 


Ou par intégration de f, pour y > 0: 


+00 y 
no / ranax= | e dx = ye? 
—00 0 


2.3 Lois conditionnelles 


Si l’une des deux variables X ou Y a une valeur fixée, on peut définir la loi conditionnelle 
de l’autre variable. Pour des lois absolument continues, les lois conditionnelles sont 
définies par les densités conditionnelles : 


F (x, y) 
Y — = 
fx @x| y) Fa G) 
f (x, y) 
X = = 
fr (y x) FA œ 


à condition bien sûr que f,(y) > 0 et f,(x) > 0. 


Exemple 4.8 
Si nous reprenons la loi précédente, nous obtenons pour 0 < x < y: 
er, 1 
fxQW == —=- 
ye? y 


donc la loi conditionnelle £L(X|Y = y) est la loi uniforme sur [0, y], pour y > 0 fixé. 
De même, pour y > x >0: 


e Le 
ROPRENE ZE 


qui est la loi exponentielle sur [x, +, pour x > 0 fixé. 
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L'indépendance des v. a. X et Y se définit alors par : 
fr = fx) fr0) VreR,VyeR 
On a bien entendu dans ce cas : 


fxGÙY =) = /fxQ) et f;OIX=x)=/f;( VxeR,VreR 


2.4 Moments associés à un couple 


Sih : R? — R est une application continue, l'espérance de A(X, Y) se calcule pour 
une loi de densité f par l'intégrale : 


EmANI= | | h(x, y) f (x, y) dxdy 
R2 


Dans le cas particulier où hA(X,Y) = [X — E(X)J[Y —- E(Y)], ceci définit la 
covariance : 


Cov(X,Y)= E{IX - E(X)IY -E(Y)]} = E(XY)-E(X)E(Ÿ) 


Dans le cas particulier où les v.a. X et Y sont indépendantes : 
E(XY) = / | xyf (x, y) dxdy 
R2 


= J xx coax | fr ar = E(X)E() 
R R 
et par conséquent : 

Cov(X,Y)=0 


Il faut faire attention à la réciproque, généralement fausse, c’est-à-dire que si deux 
v.a. Ont une covariance nulle elles ne sont pas forcément indépendantes, sauf dans le cas 
particulier où (X, Y) est un couple normal (cf. Propriété 4.2). 


Exemple 4.9 
Soit X une v.a. de loi N(0, 1) et définissons Y = X?. On a: 


Cov(X,Y)=E(XY)-E(X)E(Y)=E(X*)=0 


car tous les moments d’ordre impair sont nuls ; donc les v.a. X et X? ont une co- 
variance nulle alors qu’elles sont dépendantes (mais non linéairement) puisque la 
seconde est fonction de la première. 


On peut définir également le coefficient de corrélation linéaire par : 
Cov(X,Y) 


p =corr(X,Y) = 66) 


ayant posé V(X) = o?(X) et V(Y) = o°(Y). 
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Nous allons établir que ce coefficient est compris entre —1 et +1, en raison de 


l'inégalité de Schwarz : 
lE(XY)I< 1E (X2)\/E (T2) 


que l’on obtient en considérant le polynôme en 1, toujours positif : 
E(X - 1Y}) = dE (Y°)-24E(XY)+E(X°)>0 
ce qui implique E2(XY) — E (X 2) E (7?) < 0, soit en appliquant cette inégalité aux 
variables centrées : 
ICov(X,Y)|<o(X)o (7) 


et par conséquent |p| < 1. Le cas [p| = 1 correspond à l’existence d’une relation affine 
entre les deux variables : 


lp = 18 4 ER*,HBER:Y =aX+b 


Cette relation affine, quand elle existe, s’écrit d’ailleurs précisément : 
Cov(X,Ÿ) 


A 


2.5 Régression 


Les densités conditionnelles permettent de calculer les moments conditionnels, comme 
par exemple les espérances ; on peut définir notamment la fonction : 


xk E(Y]IX = x) 


qui s’appelle fonction de régression (non linéaire), son graphe étant la courbe de 
régression de Ÿ en X. 


Pour une loi absolument continue, on obtient : 


+00 


+00 
Eœx=0s / PA OX = wdy= fl Es 


TG) 


Exemple 4.10 


En reprenant toujours la même loi des exemples précédents, on obtient ici : 
+00 +00 
EYIX == / vevayse | yd (—-e7) 
X X 
+00 
=x+e | edy=x+l 
X 
Notons que E(Y |X) est une v.a., comme fonction de la v.a. X, et que ses réalisations 


sont les valeurs E(Y|X = x) pour tout événement élémentaire « tel que X(w) = x. On 
peut donc calculer l’espérance mathématique de cette v.a. : 
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ETE (Y1X)] = / 


O0 


+0 +00 
- | »(] rwax)a= | 


Le) +00 +00 
ECYIX =» fxtodx= | / vf (x, y) dxdy 


+00 


Yfy ©) dy = E(Y) 


CO 


Aüinsi, en prenant l’espérance de E(Y | X) par rapport à la loi de X on retrouve E(Y). 


Exemple 4.11 


Dans l’exemple précédent on a obtenu la va. E(Y]|X) 


= X+1et E[E(Y]|X)] = 


E(X) + 1 = 2 qui est bien l’espérance de Y qui suit une loi y (2). 


On peut également calculer la variance conditionnelle : 


V (YIX = x) = E{[Y -E(Y|X = x)|X = x} 
= E(Y?\]X=x) -E(YIX = x) 


De même V(Y | X) est une v.a., étant fonction de X, dont on peut calculer l’espérance. 
On démontre que la variance de Y se décompose à partir des deux premiers moments 


conditionnels de la façon suivante : 


VY)=EIVYIXI+VIE(TIX)] 


2.6 Loi d'une somme 


La loi de la va. Z = X + Y se détermine par sa f.r G, définie par : 


G(z)=P(Z<z)=P(X +Y <2) 


qui ne peut se calculer que si l’on connaît la loi du couple (X, Y). 


Dans le cas particulier où ce couple admet une densité f, on obtient : 


G@= | | réwaay 
D 


où le domaine d’intégration est D = {(x, y) /x + y < z}. On effectue le changement de 


variable suivant : 


X = X X = X 
S=xX+)y Y=sSs—-x 
Le jacobien de cette transformation est : 


D(x, y) | 


D(x,s) |-1 1 


d’où l'intégrale : 


+oo Z—Xx +oo Z 
c@= | ax | sand | ax f(x,s—-x)ds 
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qui peut s’écrire sous la forme : 
G()= ’ g(s)ds 


ce qui permet de mettre en évidence la densité de Z, soit : 


+00 
s@= / f,s-x)dx 


Dans le cas particulier où X et Ÿ sont indépendantes, la loi de Z = X + Y se 
détermine à partir des densités marginales f, et f, : 


+00 Z Z 
c@= f ’. F6 frs dsdx = | g(s)ds 


où la densité g de Z est définie par : 


+00 +0 
s@= FO G-0ax= | fxG-—7y) fr O)dy 


et g S’appelle alors le produit de convolution de f, et f;. 


Exemple 4.12 

Soit X et Y deux v.a. indépendantes et de même loi de Laplace, ou double expo- 
nentielle, de densité sell. On a vu que la densité du couple (X,Z = X + Y) était 
fx) f;(z — x) et la densité marginale de Z s’obtient donc par intégration : 


+00 +oo 1 1 
8 (z) = / Fx O9 y (& — x) dx = / Se Der iax 


— CO 


1 Z 1 +00 
= ri / el 7% + î / er *Xlqx 
—o z 


Pour pouvoir retirer la valeur absolue, il faut connaître le signe sur l’intervalle 
d'intégration et pour cela distinguer deux cas : 


z 0 +00 
Ag (z) = / ex Eax + } e*dx + jl Be da 
—00 Z 0 


1 Z 1 +00 
due Al 
de — ze° + Lez =(1-z)e 

2 2 


—si z < 0: 
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—si z > 0: 


0 LA +00 
Ag (z) = J e dx + e “dx + j e gx 
—00 0 Z 


= e” Le +ze 7+e’ [se] " 
2 ls 2 


se +ze 7 + se = (1+z)e * 


Z 


La densité de Z = X + Y pouvant s’écrire dans tous les cas : 


g (&)= T0 + pet 


Vecteur aléatoire 


Nous allons étendre maintenant les notions précédentes au cas d’un vecteur aléatoire 
ayant n composantes, avec n > 2. Un vecteur aléatoire X de R" est une application de 
€ dans R” qui s’écrit sous la forme d’un vecteur colonne : 

X: 

X=| : 
X, 

dont toutes les composantes X;,1 < i < n, sont des v.a., c’est-à-dire des applications de 
€ dans R. On définit alors l’espérance de ce vecteur aléatoire comme le vecteur dont 
les ñn composantes sont les espérances des v.a. réelles composantes de ce vecteur et on 
conserve la même notation qu’en unidimensionnel : 


E (Xi) 
EX) =| : 
E(X,) 


Dans le cas d’un couple aléatoire, nous avions introduit la covariance comme mo- 
ment centré d’ordre deux ; s’agissant ici d’un vecteur à n composantes aléatoires, il faut 
considérer toutes les associations deux à deux de ses composantes. La généralisation de 
la variance définie en unidimensionnel, indicateur numérique de dispersion autour du 
centre, sera ici une matrice, notée encore V(X), et qui contiendra toutes les variances 
des composantes de X, ainsi que les covariances de tous les couples associant deux 
composantes. Cette matrice est aussi un indicateur de dispersion autour du centre E(X) 
qui renseigne sur la forme de l’ellipsoïde d’inertie ; c’est une matrice carrée symétrique 
d'ordre n, appelée matrice de variances-covariances, et définie par : 


V(X)= EUX -E(X) [X-E(XN) 
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c’est-à-dire comme l'espérance d’une matrice M dont les éléments sont des va. M;; 
et qui est définie comme la matrice d’éléments E(M;;). L'élément ligne i, colonne j, de 
cette matrice, 1 < i, j < n, est d’ailleurs : 


v; = E{[X;-E(X;)1[X;,-E(X;)]} = Cov(x;,,X;) 
et par conséquent on trouve les variances sur la diagonale principale de cette matrice : 
= E{[X-E(x)}}=v (x) 


Comme propriétés de ces deux moments généralisés, nous allons examiner les ef- 
fets d’un changement d’échelles, traduit par une application linéaire de R" dans R” de 
représentation matricielle À de format (m, n), puis d’un changement d’origine, traduit 
par une translation de vecteur b de R”’. Le vecteur X devient après cette transformation 
affine le vecteur Y = AX + b. L'opérateur espérance mathématique est toujours linéaire 
en multidimensionnel et le vecteur espérance va donc subir la même transformation : 


E(Y)= E(AX +b)= AE(X)+b 


alors que la matrice de variances-covariances n’est pas modifiée par le changement 
d’origine, étant un moment centré : 


V(Y)=V (AX +b)=V (AX)= AV (X)'A 
En effet : 
Y-E(Y)=AX+b-[AE(X)+b] = A[X -E(X) 
et par conséquent : 
Y-EM)]T[Y-EMI AIX -E(X)J'[X -E(X)J'A 


On peut opérer une transformation particulière permettant d’obtenir le vecteur Y 
centré et réduit. La matrice Z = V (X) étant définie-positive admet une inverse 27! 
définie-positive et il existe une matrice symétrique S telle que S? = ZX}, qui sera notée 
S = Z-l/2, On effectue alors la transformation : 


Y=S PIX -E(X)] 


où le vecteur Y est centré puisque E(Y) = 0 et réduit, au sens où ses composantes sont 
non corrélées et de variance un : 


FOND Fe SOS ESS ET, 


TE T= ES "= d'on2s= 57" 
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F4 | Lois usuelles 


4.1 Loi multinomiale 


Il s’agit en quelque sorte d’une loi binômiale multidimensionnelle où on ne s’intéresse 
pas seulement à la réalisation d’un événement particulier À, mais à celle de k événe- 
ments distincts A,,..., À, de probabilités respectives p,,.…, p,au cours de n épreuves 
successives indépendantes. On a bien entendu p; > 0 pour 1 < j < ket > p;= ll. 
On associe alors à cette expérience aléatoire le vecteur N à valeurs dans {0, 1, LA 
dont les composantes N j 1 < j < k, représentent le nombre d'événements À j réali- 
sés. Le vecteur aléatoire N suit une loi multinomiale de paramètres n, p,, .… , p,, notée 
M (n; p1,.…,p4) et définie par : 


_ . . n! n ny 

P (N, = n,,.…., N; = ny) = alamr D, 

où(n, 1. y) € {0,1,...,n}". Il est important de noter que les v.a. composantes de N 
ne sont pas indépendantes puisque : 


2 == 


j=1 j=1 


Le coefficient qui figure devant P! .…. pe. qui représente la probabilité d’un évé- 
nement élémentaire réalisant l’événement (N 1=n.., N,= ñy), est le nombre de 
partitions de n objets en k classes d’effectifs donnés n,, avec n, +: + n, = 1, ou le 
nombre de suites ordonnées de n objets comportant n,objets identiques, 1 < i < k, 
choisis dans k classes distinctes (cf. chap. 1 Compléments $ 5). 

Si on pose ‘p = (P1. Ex ,Px); on peut écrire N > Mn; p) et ce vecteur aléatoire 
admet comme espérance : 


E (Ni) Pi 
E(N) = ! =n| : |=np 
E(N;) Pk 


En effet, toutes les lois marginales vont être des lois binômiales puisque les v.a. N,; 
représentent le nombre de réalisations de l’événement A; au cours de n épreuves in- 
dépendantes : N;-B (n,p;) avec p; = P(A;), donc E (N;) = np;et V (N;) = 
np; (1—p;). 

Pour calculer les covariances : 


Cov (N; N)) = E (N;N,;) —E(N;)E (N;) 


qui ne sont pas nulles puisque les composantes de N sont liées par une relation, nous 
avons besoin de la loi du couple (N;, N;) qui est une loi M (n:p;,p;. 1—p,— P;) ou loi 


trinômiale associée aux trois événements À;, À; et À; N A; : 
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n! 


P(N=nN;=n;)= cn CS 
n;ln;! (n —h,— n)! 
avec n; et n; entiers positifs tels que 0 <n;,+n; <n. 
Nous pouvons écrire : 
E(N;N;)=EÎNE(N;IN;)] 

en effet : 

E(NN;)= D YnnP(N=nN;=n)= ME, P(N;=n)) 
où on a posé : 

P(N;=n,N,=n,) 
E, = : : Pt y ÿ 
ñ; >. n; P (N, — n;) 


etn;E,, représente bien une réalisation de la v.a.N;E (N IN i) . Pour calculer cette espé- 
rance conditionnelle, nous allons déterminer la loi conditionnelle de NN; = n; qui est 
la loi binômiale de paramètres n—n; (on retire les n; réalisations des À) et de probabilité 
individuelle de réalisation : 
P (4, N 4) P(A 
nn J i ? P; 
P ( A, | A) _ - ( i) j 


PC) r@) 


L’espérance de cette loi binômiale est donc : 


E(NIN;)=(n-N;) 
et ainsi : 

P; 
— D; 


E(NN) =: 


L 


EI[N,(n- N;)] = er (np; — E (N?)] 
Par ailleurs : 
E(N?) = V(N;) + EN) = np(l — p;) + np? 
d’où : 
np; 


n 
E(N:N;) = npp; (—— FPE 2) Gi Dr; 


et enfin : 
Cov (N;. N;) = np;pj(n—1—n)=-np;p; 
La matrice de variances-covariances de N s’écrit donc : 


VIN) = n[p6; - p))| 


1Ki,j<k 
où ë est le symbole de Kronecker qui vaut 1 quand i = j et O sinon. 
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4.2 Loi normale vectorielle 


Nous allons définir la loi normale multidimensionnelle à partir de la loi normale qui a 
été définie dans R au chapitre 3. 


DÉFINITION 


Un vecteur aléatoire X à valeurs dans R’ suit une loi normale si toute combinaison 
linéaire de ses composantes (qui sont des v.a. réelles) suit une loi normale dans R. 
Si a est un vecteur de R" qui définit une telle combinaison linéaire, ceci s'écrit : 


n 
Xe N,eVaeR’, fX= YaxXeN, 
fil 


REMARQUE Pour ne pas introduire de restrictions sur les coefficients de la combinai- 
son linéaire, on adoptera comme convention que la loi de Dirac 6,, (cf. chap. 3, $ 1.1) 
se confond avec la loi normale N(m, 0) d’écart type nul. 


Il découle immédiatement de la définition que toutes les composantes d’un vecteur 
normal sont des v.a. réelles normales, puisqu'il suffit de choisir toutes les coordonnées 
de a nulles, sauf a, = 1,1 < i < net ainsi 'aX = X, » N.. Cependant, il faut faire 
attention que la réciproque de cette propriété est fausse en général, c’est-à-dire que si 
toutes les v.a. X, suivent des lois normales, il n’est pas certain que X soit un vecteur 
normal. C’est pour cela que lon ne peut pas définir un vecteur normal comme ayant des 
composantes normales, sauf dans un cas particulier que nous verrons ultérieurement. 


Comme dans le cas unidimensionnel, la loi normale en multidimensionnel est entiè- 
rement déterminée par deux paramètres qui sont ici le vecteur espérance y = E (X) et 
la matrice variances-covariances Z = V (X), la densité au point x = (x,,...,x,) ayant 
pour expression : 


LD = + — exp À (x = n) EUX = y) 


CCE 


il s’agit de la généralisation de l’expression de la densité de la loi N,(#, 0?) que lon 
peut écrire sous une forme équivalente, dans le cas où x € R: 


JD = exp 2" — Ho) (x — 4) 
Vive 2 

Le terme de l’exponentielle fait intervenir la métrique définie par la matrice 27! : 
I[x — ESS On écrit symboliquement : X- W',(u, 2). Remarquons que cette notation 
n’est pas homogène avec celle retenue en unidimensionnel, puisqu’en faisant n = 1 le 
second paramètre est ici la variance alors que figurait dans le cas réel l’écart type comme 
second paramètre. On peut remédier à cet inconvénient en distinguant dans le cas réel 
les notations W(y, 0?) et N(u, 0). 
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Exemple 4.13 


Étudions le cas particulier de la loi normale d’un couple (X, Y) dont la densité s’écrit 
pour |p| < 1: 


1 
PORTE * 
2x6%0y V1 — p? 2(1 — p?) 


2 4 
x — X— = _ 
( Hx ) 2p HxJ Hy (2 æ) | 
OX Ox Cy Cy 


Par identification avec l’expression générale de la densité de la loi normale, nous 
allons voir comment interpréter les cinq paramètres qui apparaissent ici. Tout d’abord 
on voit que det Z = 6% 67(1 — p?). Par ailleurs, on remarque aussi que le crochet de 
l’exponentielle est une forme quadratique de x — 4, et y — y, qui peut s’écrire : 


1 
los 4x) — 206x07 (x — Ha) — 47) + 0% 0 — y) 
X Y 


Le terme de l’exponentielle peut donc s’écrire : 


1 o2 — PO y O X—U 
rs, e Y xO0Y x 
Zdet >" Hx  Y—HYr) ( —POxOy 6% Y—Hy 
On voit bien alors sous cette forme que (X, Y) est un couple de v.a. normales, d’espé- 
rances respectives y, = E(X) et y; = E(Y) et de matrices variances-covariances 


Z vérifiant : 
s-1 = 1 6? —POxOy 
detZ | —-po,6y 0? 


X 
d’où : 
5 = 04 POxOy 
PO yxOy 0? 
ce qui permet d’en déduire que 0? = V(X), 0? = V(Y) et Cou(X,Y) = 


pox6y donc p = Corr(X,Y). 


Nous allons déterminer maintenant la régression de Y sur X : 


+00 
E(YIX = x) = / YfrOIX = x)dy 
avec ici : 
FX; y) 1 1 
> — EE  ————  — — —— | 
frOIX = x) F@) TRES ap { TE Pt »} 
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2 
ii —") 
nn — P 
Cy Ox 


Pour calculer l'intégrale, on fait donc le changement de variable : 


L _ 
Ts, RE TE et dy=0oyV1-pdu. 
Cy Cx 


On obtient alors : 


E(YIX = x) 


© 
or Vi = RP +p— (x ux) + uy| e"/?du 


Ox 


1 [” 
V2r J- 


Cy 
P—(X — Ux) + Hy 
Ox 


la fonction de régression d’une variable d’un couple normal sur l’autre est donc une 
fonction affine, c’est-à-dire que la courbe de régression est ici une droite. Dans le cas 
particulier où les variables sont centrées et réduites on obtient la régression linéaire 
E(Y|X) = pX. 


a) Cas particulier 


Après la définition de la loi normale vectorielle, nous avions noté que n v.a. réelles 
normales ne constituaient pas nécessairement les composantes d’un vecteur normal. 
Cependant, si X,,...,X, sont des v.a. normales indépendantes, de lois respectives 
N(u;,6;), 1 < i < n, alors elles constituent les composantes d’un vecteur X normal, 
toute combinaison linéaire de v.a. normales indépendantes suivant une loi normale. Ses 
paramètres sont : 


n 


a 

Hi 0 
E(X)=| : et V(X) = 

Un 0 

cu 
avec pour densité au point x = (x,,...,Xx,): 
- 1 
f@o=]T exp ——(x; — 4) 
CE 


Il 
Q 
x 
Le) 
| 
= 
M: 
PTE 
À 
a|I 
E 
Vo 
Le] 
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Dans le cas particulier de variables centrées et réduites, c’est-à-dire pour y, = 0 et 
6, = 1,1 < i < n, on obtient la loi normale standard vectorielle, X- N (0, Z,), de 
densité : 


dd Is. 1 Fe 
f(x) = SN 2 L ne PT Ix|l 


CS 


la norme étant ici la norme euclidienne classique. 


Théorème 4.1 RE eeeeeeere een ee eee eee ee ee ETS : 


i Si X,et X ; sont les composantes d’un vecteur normal, elles sont indépendantes si È 
É et seulement si leur covariance est nulle : Cow (X,;, X 5)=0. î 


CCEPECEPEC EEE ELEC ELEC ELEC ELECEC EEE EEC ELEC EEE EEE PEEEEEECENECEECEEEEC EEE EECEEEEEETETENEEET EE EEE EEE EEE EEE TETE 


Nous avons ici un cas particulier où la covariance nulle implique l’indépendance. Il 
faut cependant bien faire attention à l’énoncé de cette propriété, car si X; et X'; sont deux 
variables normales dont la covariance est nulle, cela n’implique pas forcément qu’elles 
soient indépendantes. Pour s’en convaincre examinons l’exemple suivant. 


Exemple 4.14 

Soit X de loi N(0, 1) et € de loi définie par P(e = 1) = P(E = —1) = ; deux va. 
indépendantes à partir desquelles on définit la v.a. Y = £X. La loi de probabilité de 
cette nouvelle variable est définie par : 


P(Y < y) = P(EX < y) 
= P{(EX <y)n(e=1)}+ P{(EX < y n(e=-1)} 


= PX . SPC-X .. 


1 
Sn 
où ® est la fr. de la loi N(0, 1) qui est donc la loi suivie par Y. Par ailleurs : 
Cov(X,Y)=E(XY)-E(X)E(Y) = E(eX°) = E(e)E(X°) =0 


Si on en concluait que X et Y étaient deux variables indépendantes, la va. X + Y 
suivrait alors une loi N (0. V2 }: Or : 


PO 4 Y = 0)= P{(E + DX = 0) = PE =-1)= 3 


ce qui est incompatible avec le fait que la loi de X + Y soit continue. On a donc 
établi que X et YŸ sont deux variables normales de covariance nulle et cependant 
dépendantes. 
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b) Transformation affine d'un vecteur normal 


Soit X un vecteur de loi N° ,(4, 2) et de composantes X,, 1 < i < n. Nous allons 
effectuer une transformation affine à partir d’une matrice À de format (m, n), traduction 
matricielle d’une application linéaire de R” dans R°”, et d’un vecteur de translation b de 
R": Y = AX + b. Nous allons établir tout d’abord que le vecteur Y est aussi normal. 
En effet, si a est un vecteur quelconque de R”’, la combinaison linéaire : 


laY = (aA)X +'ab= V'aX,+peN 


i=1 


ayant posé ‘a = ‘aÀ, vecteur de composantes «;, 1 <i<n, et 8 = 'abEe R. En effet, 
par définition de la loi normale vectorielle, la combinaison linéaire ‘a X est une v.a. réelle 
normale et donc aussi ‘a X + f. Aïnsi, toute combinaison linéaire des composantes de 
Y suit une loi normale, ce qui signifie par définition que Y est un vecteur normal de R”. 
D’après les propriétés des opérateurs espérance et variance vues au $3, ses moments sont 
E(Y) = AE(X) + b = Au +b= yet V(Y) = AZ'A =}, et ainsi Y = N,(u', 2). 

Dans le cas particulier d’une transformation linéaire, c’est-à-dire avec b = 0, et pour 
un vecteur X de loi normale standard, X -> N° (0, Z,), alors : 


Y = AX » N,(0, A'A). 


c) Loi du khi-deux 


Soit un vecteur X de loi normale standard W°,(0, 1,) et À une matrice symétrique d’ordre 
n. On établit le résultat suivant : 


'XAXe &  Aest une matrice idempotente de rang p. 


Rappelons que À est idempotente si 4? = À et que dans ce cas rangA = trace A. 


Si À et B sont deux matrices symétriques et idempotentes, on a également le résultat 
suivant : 


‘XAX et'X BX sont des v.a. indépendantes & AB = 0. 


© Compléments 


5.1 Application mesurable 


Les notions vues dans le chapitre 2 se généralisent en multidimensionnel, où R" est 
muni de sa tribu borélienne B, engendrée par les ouverts ou les pavés de la forme 
IL. ] — ©, X; [. Un vecteur aléatoire X est alors défini comme une application mesu- 
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rable de (Q, À ) dans (R", B ). La loi de X admettra une densité si elle est absolument 
continue par rapport à la mesure de Lebesgue À de R", définie à partir de : 


À (re »1) = [[é;- a). 
i=1 i=1 


5.2 Changement de variable 


Soit g : R" — R" une application bijective de X(Q), ouvert de R”, dans un ouvert de 
R’, admettant des dérivées partielles continues ainsi que son inverse g”!. Si X est un 
vecteur aléatoire de R” de densité f, alors Y = g(X) est un vecteur aléatoire de R" de 
densité h définie par : 

D(x) 
D(») 


représente le jacobien de la transformation inverse, c’est-à-dire le déterminant 


RO) = fle | 


D(y) 
des dérivées partielles des anciennes variables exprimées en fonction des nouvelles sous 


la forme x, = gr! (y), 1 < i < n, donc ayant comme élément ligne i, colonne j, 
1<j<n: 


08; (y) 


dy; 


Si on retient comme application la convolution, pour obtenir la loi de la somme de 
n va. indépendantes X,,...,X, on fait le changement X, = X,,...,X,, = X 


n-1l° 

Y = X, +. + X,. Les anciennes coordonnées s’écrivent sous la forme 
_ = = A ; je A 

Xy = Xp, Xp y = Xy_Xy = YŸ — Xj — + — X,_, d'où un jacobien égal à un et 


une densité de YŸ qui se détermine par : 
h(y) = FX... Xp ny Xi) —..—Xx, 1)dx, ... dx, ; 
Rr-1 


Dans le cas d’un couple aléatoire (X, Y) transformé par l’application g en couple 
(U, V) on détermine les anciennes coordonnées en fonction des nouvelles sous la forme 


x = x(u,v) et y = y(u,v) et l’élément différentiel f(x, y)dxdy est transformé en 
1 DC») re 
fLg= "Cu, v)] | an | dudv où : 


Ox(u,v)  Ox(u, v) 


D(X, y) _ ou dv 
D(u, v) dy(u,v)  dy(u,v) 
ou ou 
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Deux v.a. sont indépendantes si la loi du couple s'obtient comme pro- 
duit des lois marginales : produit des probabilités des points dans le cas 
discret et produit des densités dans le cas continu. 


La covariance est une mesure de la dépendance linéaire entre deux 
v.a. Deux v.a. indépendantes ont une covariance nulle. La réciproque 
est fausse en général. Cependant, si deux v.a. sont des composantes 
d'un vecteur normal et que leur covariance est nulle, alors elles sont 
indépendantes. 


La fonction de régression d'une variable Ÿ sur une variable X associe à 
tout réel x l'espérance (moyenne) de Y lorsque la valeur de X est fixée, 
égale à x. 


Un vecteur aléatoire admet comme composantes des variables aléa- 
toires réelles. On lui associe comme moments son espérance, carac- 
téristique de valeur centrale, vecteur dont les composantes sont les es- 
pérances des v.a. composantes, et sa matrice de variances-covariances, 
caractéristique de dispersion dans l'espace, qui rassemble les variances 
des composantes sur la diagonale principale et les covariances des 
composantes associées deux à deux pour les autres éléments. 


Par une transformation affine (changement d'échelles et d'origine), les 
moments deviennent : 


E(AX + b) = AE(X) + b 
VAX + b) = AUX'A 


pour toute matrice À de format (m, n) et tout vecteur b de R”. 
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4.1 


4.2 


4.3 


4.4 


Entrainez-vous (@) 


Soit (X, Ÿ) un couple de v.a. discrètes dont la loi de probabilité est donnée par le tableau 
ci-après : 
1 2 3 4 
0,08 0,04 0,16 0,12 


0,04 0,02 0,08 0,06 
0,08 0,04 0,16 0,12 


1. Déterminer les lois marginales de X et Y et préciser si ces v.a. sont indépendantes. 
2. Calculer Cou(X, Y). 

3. Déterminer la loi du couple (min{ X,Y},max{X,Y }). 

On lance successivement trois pièces de monnaie et les v.a. X et Y désignent respec- 
tivement le nombre de faces apparues sur les deux premières pièces et le nombre de 
piles sur les deux dernières. 

1. Déterminer la loi du couple (X, Y), puis les lois marginales de X et Y et indiquer si 
ces v.a. sont indépendantes. 

2. Calculer Cou(X, Ÿ). 

Soit (X, Ÿ) un couple de v.a. discrètes dont la loi de probabilité est donnée par le tableau 
ci-après : 


y À | o 1 2 
1 1/12 O0 1/12 
2 2h12 41/12 1/12 
3 3/12 2/12 1/12 


1. Déterminer les lois marginales de X et Y et préciser si ces v.a. sont indépendantes. 
2. Calculer Cov(X, Ÿ). 

3. En déduire la loi de probabilité de la variable aléatoire E(Y]|X). Calculer 
E[E(Y|X)]; le résultat était-il prévisible ? 

Soit (X, Y) un couple de v.a. discrètes dont la loi de probabilité est donnée par le tableau 
ci-après : 


+ SF) T & #. 4 
1 D 0 © 060$ 
2 02 O0 Oo 
3 0 O0 01 oO 
4 0,3 01 O 0 


Déterminer les lois conditionnelles de X sachant que Y = 1 puis de Y sachant que 
XE {3,4}. 
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4.5 


4.6 


4.7 


4.8 


4.9 


4.10 


4.11 
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Soit X et Y deux v. a. de loi normale centrée et réduite et de coefficient de corrélation 
linéaire p = sin 0. On montre que P(X > 0,Y > 0) = : + _ = D. 

1. Déterminer la loi de probabilité des v. a. —X et —Y et en déduire la valeur de 
P(X <0,Y < O0). 

2. Soit X, et X, deux v. a. qui ont la même loi que X et Y,, Y, deux v. a. qui ont la 
même loi que Y, les couples (X',, Y.) et (X, Y>) étant indépendants. Déterminer les 
lois de probabilité des v. a. U = X, — X, et V = Y, — Y,. Calculer le coefficient de 
corrélation linéaire de U et V et en déduire P(U > 0, > O). 

3. On définit les va W=1sU>0,W=-I1SsU <0,Z=1siV >0et Z =-1 
si V < 0. Calculer E(W Z). 

Soit X et Y deux v.a. indépendantes de lois de Poisson de paramètres respectifs À et y. 
Déterminer la loi conditionnelle de X lorsque la somme S = X + Y a une valeur fixée 
S = s. En déduire l’expression de la fonction de régression de X sur $S puis la valeur 
de E[E(X1S)]. 

Un couple (X, Y) de variables aléatoires réelles admet pour densité f(x, y) = exp(y—x) 
pour 0 <y< let y < x, avec f(x, y) = 0 sinon. 

Déterminer les densités marginales de X et Y. Les variables aléatoires X et Y sont-elles 
indépendantes ? 

Paul et Virginie se fixent un rendez-vous entre 11h et midi, sans autre précision. Comme 
ils sont impatients tous les deux, celui qui est arrivé part au bout d’un quart d’heure si 
l’autre n’arrive pas pendant ce laps de temps. Calculer la probabilité p qu’ils se rencon- 
trent effectivement à ce rendez-vous. On formalisera le problème en considérant que 
l’arrivée de chacun se produit au hasard pendant l’heure fixée du rendez-vous. 

Soit (X, Ÿ) un couple de v.a. dont la loi est déterminée par la densité : 


xy/2 S0<x<2et0<y< x 
0 sinon 


16.» = { 


1. Déterminer la fonction de répartition F de ce couple. 
2. Déterminer les lois marginales de X et Y. Ces variables sont-elles indépendantes ? 
3. Déterminer la loi conditionnelle de Y sachant que X = x. 


Soit (X, Ÿ) un couple de v.a. de densité : 


= S0<x<y<l 
f(x, y) = 4 Vxy 
0 sinon 


1. Déterminer la valeur de la constante k puis la fonction de répartition F de ce couple. 
2. Déterminer les lois marginales de X et Y. Ces variables sont-elles indépendantes ? 
3. Déterminer les lois conditionnelles de X|Y = yet de Y|X = x. En déduire 
l’expression de la fonction de régression x  E(Y |X = x) puis calculer E[E(Y|X)|]. 


Soit X et Y deux v.a. indépendantes et de même loi uniforme sur ] — 1,1[. Déterminer 
la loi de probabilité de la va. Z = Y — X. 
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4.12 


4.13 


4.14 
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Soit (X, Ÿ) un couple de v.a. de densité : 
1 


2x \/a 


fG ») = exp [(l + a)x2 + 2(1 + 2a)xy + (1 + da)ÿ?] 


avec a > 0. 
1. Déterminer les lois marginales de X et Y. Ces variables sont-elles indépendantes ? 
2. Déterminer la loi de la v.a. Z = L(X +Y}. 


Si X est un vecteur de loi W,,(u, 2), montrer que la v.a. réelle ‘(X — p}E IX — y) Suit 
une loi du khi-deux à n degrés de liberté. 


Soit X,,X) et X; trois v.a. indépendantes de même loi N(0, 1). Déterminer la loi de 
probabilité des v.a. suivantes : 

X,+X2) X,+X 
He Ve CS De = TE 
2 (X1 — A2) (X, — X2)? 

1 
Y = AC +2X5+5X5+4X,X)—2X,X;+4X,X;) 
- y2 2 2 
Z=X; + x; +X3 —Y 


et montrer que Y et Z sont indépendantes. 
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1. Les lois marginales s’obtiennent par sommation de lignes et de colonnes et figurent 
dans le tableau ci-après : 


x | à 2 3 4 
1 [0,08 004 0,16 0,12 | 0,4 
2 |0,04 0,02 0,08 0,06 | 0,2 
3 |0,08 0,04 0,16 0,12 | 0,4 
02 01 04 03 | 1 


On constate que toutes les probabilités des couples (x, y) s’obtiennent en faisant le pro- 
duit des probabilités marginales, donc X et Y sont indépendantes. 

2. On déduit de la question précédente que Cou(X, Y) = 0. 

3. La loi du couple (min {X,Y },max{ X, Y }) est donnée dans le tableau ci-après : 


min{X, Y} 1 - . gi 
0,08 0,08 0,24 0,12 
0 0,02 0,12 0,06 
0 0 0,16 0,12 


Donnons un exemple de la façon dont ce tableau a été constitué : 
P(min{X,Y}=2,max{X,Y}=3)=P(X =2,Y =3)+P(X =3,Y =2) 
= 0,08 + 0,04 = 0, 12 


1. La loi du couple et les lois marginales sont données dans le tableau suivant : 


YS%) @ +. 2 
(0) (0) 1/8 1/8 | 1/4 
1 1/8 2/8 1/8 | 1/2 
2 1/8 1/8 0 1/4 
1/4 1/2 1/4 1 
On voit dans le tableau que par exemple P(X = 0,Y = 0) = 0 Æ P(X = 0) 


P(Y = 0) = T donc les variables X et Y ne sont pas indépendantes. 

2. On obtient aisément E(X) = E(Y) = 1 et E(XY) = : d’où Cov(X,Y)= _—. 

1. Les lois marginales s’obtiennent par addition des lignes et des colonnes et figurent 
dans le tableau ci-après : 


FSU S 1 2 
1 [1712 0 1712] 14 
2/12 1/12 1/12 | 1/3 
3/12 2/12 1/12 | 1/2 
1/2 1/4 14 | 1 
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On voit par exemple que P(X =1,Y =1)=0Z£ P(X =1)P(Y = 1) = 1/24 donc 
les va. X et Ÿ ne sont pas indépendantes. 


2. On calcule à partir du tableau E(X) = — 3 E(Y) spores? puis 
4 4 4 Gr He 42,7 3 


E(XŸY) = 52+6+2+4+6)= 2. On en déduit Cou(X,Y)= À — 2 =- 


ce qui confirme que les variables ne peuvent pas être indépendantes. 


3. Il faut au préalable déterminer les lois conditionnelles de Y qui sont données dans le 
tableau ci-après : 


On calcule alors à partir du tableau précédent : 


7 


EYIX=0)= > EUX =1= 2 EX IX =2)=2 


On en déduit la loi : 
EMN | 2 7/3 8/3 


| 14 172 14 


puis la valeur : 
26 7 
E[E(®Y |X)]= = +- 
LE(Y IX)] ste 


On retrouve bien la valeur de E(Y). 


Comme P(Y = 1) = 0,5 la loi de X|Y = 1 s’obtient en multipliant la première colonne 
par deux et est donnée par le tableau ci-après : 


ire Dh 227 9. 4 
0 0,4 O 06 


On a P(X € {3,4}) = 0,5; on additionne les deux dernières lignes et ensuite on 
multiplie aussi par deux pour obtenir la loi de Y|X € {3,4}, donnée dans le tableau 
ci-dessous : 


YIXE{3,4)| 1 2 3 4 


0,6 0,2 0,2 O0 
1. On a: 

P(-X <x)= P(X>-x)=1-D(-x)=PD(x) = P(X < x) 
donc —X et —Y suivent aussi des lois normales centrées et réduites. On en déduit : 


P(X <0,Y <0)=P(-X>0,-Y >0)=p 
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4.6 


4.7 


2. Toute combinaison linéaire de v. a. normales indépendantes suit une loi normale, 
donc U et V suivent des lois normales centrées et de variance 2. On calcule : 


Cov(U,V)= E(UV) = E(XiM) - E(XY) - E(X2M) + E(X2Y2) = 29 


On en déduit corr (U, V) = p puis : 


mu>0v>0=r( 0 0) P 


RTE 


3. On calcule : 
E(WZ)=P(WZ=1)-P(WZ=-1)=2P(WZ =1)-1. 
Ensuite : 
P(WZ=1)=P(W=Z=1)+P(W=Z=-1) 
= P(U >0,V > 0)+ P(U <0,V <0) = 


Ainsi : 
E(W2Z) =4p-1= _ 
7 
Nous savons que ;S suit une loi de Poisson de paramètre À + y et par conséquent, 
pourO<x<s 


PNG) SP RS), ER DES PRE) 


P(S=s) P(S = 5) 
POS = x)PY =s-x) s! S Aux 
P(S = s) U oxl(s— x)! (4+u) 


OR) CA) 


ce qui montre que la loi de X[S = s est une loi binômiale de paramètres s et — 3 
h 


donc d’espérance : 


EXIS=s)=Ss 


2+y 
Ainsi, E(X|S) = s-Let E[E(X |S)] = E(S) = À = E(X). 


Les densités marginales s’obtiennent par intégration de la densité du couple : 


X 
@= / e *dy=l1-e* s0<x<l 
0 


1 
GS | e7*dy=(e-1)}e * sil<x 
0 


avec fy(x) =0six <0; 


+00 
et: nos | e’*dx =1 si0<y<l1 
y 
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la densité étant nulle en dehors de cet intervalle. 


Les variables aléatoires X et Y sont dépendantes car f (x, y) £ fx (0 fy (») 


On note X et Y les v.a. qui représentent les dates d’arrivée de Paul et Virginie à leur 
rendez-vous, en prenant 11h comme origine et l’heure comme unité de temps. Leur 
arrivée au hasard se traduit par l’hypothèse que ces deux v.a. suivent une loi uni- 
forme sur [0,1] et sont indépendantes. Leur rencontre correspond alors à l’événement 
IX —Y| < : et la probabilité p s’obtient par l’intégrale suivante : 


p=p{ix-ri<i}= / J dxay 
4 D 


où le domaine d'intégration est D = {x Y/0O<x<1,0<y<1,[x— y| < :} ; 


Compte tenu de la forme de ce domaine et de sa symétrie par rapport à la première bis- 
sectrice (c f. figure 4.5), il est préférable de calculer la probabilité du complémentaire : 


3/4 1 3/4 3 9 
1-p=2 f ax | ay=2 | (S-x)ax= © 
0 x+1/4 0 4 16 


Ainsi p = ns 


1/4 341 


Figure 4.5 


1. Si x < 0 ou y < 0 on a bien sûr F(x, y) = 0 puisque la densité est nulle dans toute 
cette zone du plan. Pour un point M(x, y) situé dans le triangle où f > 0, c’est-à-dire 
pour 0 < y < x < 2 on obtient (voir figure 4.6) : 


1° 1 FF, à 
F(x, y) = 5 vdu udu = 2 u(x" — v“)dv 
0 U 0 


X 
1 as ÿ 2 2 
= — — — = —(2 _- 
i( } 4 16 ») 


Nous allons maintenant sortir du triangle, sur l’horizontale à droite de M(x, y) pour 
nous situer en un point M,(x, y) de coordonnées telles que 0 < y < 2 < x. La valeur 
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de F en ce point est la même qu’au point d’intersection de l’horizontale avec la frontière 
du triangle puisqu’au-delà f = 0, soit : 


y? 
FN SF» = 17 G- y?) 


Figure 4.6 


Si on sort du triangle sur la verticale de M pour atteindre un point M,;,(x, y) de 
coordonnées telles que 0 < x < y et x < 2, on obtient de même : 


x4 
FX, y) = F(Xx, x) = 16 


Enfin, si x > 2 et y > 2, tout le triangle est recouvert et F(x, y) = 1. En résumé : 


0 si x < D ou y < 0 
RQ - P) si0<y<x<2 
F(x, y) = xt si0<x<2etx<y 
— Si0<y<2<x 
1 six>2ety>2 


2. Les densités marginales s’obtiennent par intégration de la densité du couple ; pour 
O<x<2: 


x 3 
X X 
fx®=3 / M3= T7 


et pour 0 < y < 2: 


< 
A 
(ee) 
| 
7 


2 
fr) = 7 xdx = F4 - y?) 


138 


© Dunod — Toute reproduction non autorisée est un délit. 


4.10 


Couple et vecteur aléatoires 


Le produit f(x) f;(») est différent de f(x, y) donc les variables X et Y ne sont pas 
indépendantes. 


3. La densité de Y sachant que X = x a pour expression quand 0 < y < x: 


4 _ 2y 


se Te 
PASS 


1. L'intégrale de f sur R? doit être égale à 1 ; elle se réduit à l'intégrale sur le domaine 
D où elle est non nulle : 


1=k 1e Ee = 2k IEDLE 


donc k = 5: Remarquons que si l’expression de f est symétrique en x et y, il n’en est 
pas de même du domaine D et il aurait été plus rapide ici d’intégrer d’abord par rapport 
à x. 


Si on note À le domaine défini par x < xÿ et y < yo, par définition F(xo, Yo) = 
Î /\ fG; ydxdy. Bien entendu, si x6 < 0 ou yo < 0, A n’a aucun point commun avec 
D où f > 0, donc F(xo, yo) = 0. Pour un point M(xo, Yo) situé dans D maintenant 
(voir figure 4.7) c’est-à-dire tel que 0 < x6 < yo < 1: 


FD f fosse 3f Ÿ a LE (vi 2Vx) 
= PAR )a- rev -v) 


* M, (x;:Y0) 


Figure 4.7 


Notons qu’ici il fallait d’abord intégrer par rapport à y, car sinon il aurait fallu séparer 
D N A en deux domaines d’intégration. Pour les autres zones du plan, si nous quittons 
D sur une horizontale, à droite du point précédent, la valeur de F au point M,(x:, yo) 
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est la même qu’au point d’intersection avec la frontière de D, puisqu’au-delà f = 0, 
soit pour un point de coordonnées telles que x, > y9 > 0 et yo < 1 : 


F (x1, Yo) = F (Yo: Yo) = Yo 


Si maintenant nous quittons le domaine D sur une verticale au-dessus du point 
MX; Yo), nous atteignons un point M; de coordonnées x, et y,, avec 0 < x9 < 1 < y; 
et en ce point : 


Fo; 1) = Fo, D) = V2o(2 cs V%o) 


Enfin, si x, > 1 et yo > 1, alors DNA = Det F (x, yo) = 1. En résumé : 


si x < O ou y < 0 
2/xy-x si 0<x<y<l 
F(x;,y)=4 2/x-x sSO0O<x< 1 <y 
y si 0<y<xet y<l 
1 si x > lety > 1 


2. On peut en déduire les f.r. marginales : 
0 si x < 0 


Fx(x) = F(x + co) = 2Vx-x si 0O<x<l 
1 si 1 < x 


0 siy<0 
FyO) = F(+o,y)=4 y S0<7y<l 
1 sil<y 


On en déduit les densités par dérivation ; pour 0 < x < 1: 


fx) = — —-1, 
Fe 


X 


résultat que l’on peut retrouver par intégration de f : 


+00 1 
fx) = FG, y)dy = [ 


U = NU 

La loi de Y est la loi uniforme sur [0,1], avec fy(y) = 110 <y< 1. 

Comme f(x) fy(y) £ f(x, y) on en conclut que X et Y ne sont pas indépendantes. 
3. Les lois conditionnelles peuvent se définir par leurs densités. Pour 0 < y, < 1, quand 
O<x< y: 

FO yo) = 1 

fr 0) 2 XYo 


fx [Y = yo) = 


Pour 0 < x, < 1 et quand x, <y< 1: 
Fo») 1 


Fax Go) 201 /x0) > 


frOIX = xo) = 
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4.11 


Couple et vecteur aléatoires 


On peut alors déterminer la régression : 
1 ly 1 x04/%0 1 
E (FX = 0) = 1 f Hope NT LL s + x) 


2(1- x) x) V? 3(1-%) 
On calcule alors : 


Hi t ff A 1 
LEGS | EUX = x) fx @odx = à | (+) dx = = 
ne 0 


qui est bien la valeur de E(Y). 


Les va. X et Y ont la même densité f(f) = 1110 et comme elles sont indépen- 
dantes, la densité du couple (X,Y) est f(x) f(y). Pour obtenir la densité du couple 
(X, Z) on effectue le changement de variable suivant : 


X=X 
Z=y—x 


Les anciennes variables s'expriment alors par : 


X = X 
Y=Z+X 
ce qui permet de déterminer le jacobien de la transformation : 
pa» _|1 0). 
D(x,2) |1 1|. 


Le couple (X, Z) a donc pour densité f(x) f (x+2) et la densité marginale de Z s’obtient 
par intégration : 


+oo 


g(z)= fG)f(x + z)dx 


—00 

L’intégrande sera non nulle si on a simultanément —1 < x < 1 et —1—2z < x < 1 —2z, 
soit max{—1,—1 —z} < x < min{1,1 — z}. Nous allons distinguer deux cas : 

—si z <0: 


=] —]l — 2 1 1 —7z 


la densité est non nulle pour —-1—z < x < 1, condition qui ne peut être réalisée que si 
—1-2z < 1,soit z > —2; dans ce cas : 
Gal Lei: 
id He A 


—siz >0: 
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4.13 
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la densité est non nulle pour —1 < x < 1—z, condition qui ne peut être réalisée que si 
—]1 < 1—z, soit z < 2; dans ce cas : 


Fee. 
«= | A 302) 


1 
On obtient ainsi : 
10-14) Haras 
8(z) = 
0 sinon 


1. L’argument de l’exponentielle dans la densité peut aussi s’écrire : 


né eu) NT Re ER PNR 

2a 14 Gidod+ro Lre 
L'exemple 4.13 montre que le couple (X,Y) suit une loi normale, donc les lois 
marginales de X et Y sont des lois normales centrées de variances respectives 


64 = 1 + 4aet Es = 1 + a. Enfin, par identification on voit que : 
Ps 1+2a 
CxOy (1 + da)(1 + a) 
donc p = - Let par conséquent Cov(X, Y) = —1 — 2a. Les variables X et Y 
X0Y 


sont donc dépendantes. 
2. La définition d’un vecteur normal implique que la combinaison linéaire X + YŸ suive 
une loi normale, avec : 


E(X+Y)=0etV(X+Y)=V(X)+2Cov(X,Y)+V (Y)=a 


On en déduit que Z' suit une loi x étant le carré d’une v.a. de loi normale centrée et 
réduite. 


La matrice X est symétrique réelle, régulière et définie positive, donc il existe une ma- 
trice orthogonale S' (i.e. telle que SI = !'S) telle que SIES = D, où D est une 
matrice diagonale d’éléments 1;,1 < i < n. Ainsi : 


Z = (Xp) (XX — pu) = (X — n)SD ST (X — y) 


Le vecteur Y = S1(X — u) = !,S(X — y) suit une loi normale centrée, de matrice 
variances-covariances V(Y) = SIES = D qui est diagonale, donc ses composantes 


Y,,1 <i< n, sont indépendantes, de loi N (0, Va Je On obtient alors : 


i? 
n y2 
Y. 
Z='YD !Y = > ais 
dd ); 
f=1 
qui est la somme des carrés de n v.a. normales indépendantes centrées et réduites, donc 
suit une loi ee 
On aurait pu également introduire la matrice À = D-1/25-1, où la matrice D7!/2 est 
la matrice diagonale d’éléments 1/4/4;, le vecteur U = D-!/2y = A (X — y) suivant 
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4.14 


Couple et vecteur aléatoires 


une loi normale standard, avec Z = ‘UU = + U?= pe Par ailleurs, si on pose 
B=A !: 


B'B=SD!'/2p!//2$-1 = Sps-!=x 


donc la matrice Z peut s’écrire sous la forme B'B et le vecteur X sous la forme 
X = BU + y, avec Us N,(0,1,). 


La variable U est une combinaison linéaire de deux va. normales indépen- 
dantes et centrées, donc suit aussi une loi normale centrée, de variance V(U) = 
3 [XD + VO] = 1. 
_ (X 1 + X)) suit une loi normale centrée réduite. D’autre part : 


Rs 
1 ( 1 1e }-L(rtx)=(5) 
V2 -1 1 X) V2 XX: U 
suit une loi normale dans R?, comme image linéaire du vecteur normal de composantes 
X, et X,. Les composantes de ce vecteur normal sont telles que : 


De même, la v.a. U' = 


Cov(U,U')= E(UU') = ; [E(XS) — E(X?)] = 0 


donc elles sont indépendantes. Ainsi, V = 7? JU? est le rapport de deux lois # 
indépendantes, donc suit une loi de Fisher-Snedecor F(1, 1) (cf. chap. 5, 3.1). Le rap- 
port W = U'/ Vu? suit une loi de Student (cf. chap. 5, 3.1) à un degré de liberté, 
c’est-à-dire la loi de Cauchy. 

Si X est le vecteur normal de composantes X,,X, et X;, on peut écrire Y ='XAX en 
ayant posé : 


2 —1 

A=-| 2 2 2 
—1 2 5 

La matrice À étant symétrique et idempotente (A? = A), avec rangA = traceA = 2, 
on en conclut que Ÿ suit une loi He 
D'autre part, Z='XX-Y ='X(I1- A)X = 7? car 1 — À est une matrice symétrique 
idempotente, de rang égal à sa trace, c’est-à-dire un. De plus : A(I — A) = À — A? = 
A— A =0, donc Y ='XAX et Z = 'X(I — A)X sont indépendantes. 
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Loi empirique 


Si le hasard conduit à un résultat non prévisible, l'observation de plusieurs résultats d'une 


même expérience aléatoire permettra cependant de choisir judicieusement le modèle 
aléatoire à retenir. En jetant un dé plusieurs fois consécutivement et en notant le résul- 
tat à l'issue de chaque jet, nous obtenons une suite de nombres entiers compris entre un 
et six, obtenus dans les mêmes conditions et de façon indépendante, que nous pourrons 
appeler échantillon de la loi associée à un jet de dé, qui est on le saït la loi uniforme sur 
l'ensemble{1,2,3,4,5,6}. Si on calcule la fréquence (pourcentage) observée de chacun de 
ces chiffres, pour un nombre suffisament élevé de lancers, on obtiendra une distribution 
empirique (c'est-à-dire obtenue par l'observation) de valeurs proches les unes des autres 
et proches de la valeur 16,7 %. Ceci nous oriente donc vers la loi théorique qui est la 
loi uniforme attribuant la même probabilité 1/6 aux chiffres 1, 2, 3, 4, 5 et 6. C'est donc 
à partir d'observations qui vont constituer ce qu'on appelle un échantillon qu'on pourra 
déterminer la distribution empirique nous permettant de retenir la distribution théorique 
qui lui ressemble le plus, dans la liste des lois usuelles vues au chapitre 3. Les tests d'adé- 
È quation nous donnent des critères précis permettant de retenir une loi théorique pour le 
È modèle, qui paraisse raisonnable compte tenu des observations recueillies. 


Hate la notion d'échantillon. È ?  Échantillon 

Bin les lois de Student et de 5 ? Loi empirique î 
È Fisher-Snedecor associées à un i : Moments empiriques | 
| échantillon gaussien.  ? Test du khi-deux È 
| deux tests d'adéquation à une  ? ? Test de Kolmogorov-Smirnov Ë 
: loi donnée. RU “ 


() Échantillon d'une loi 


On appelle échantillon de taille n d’une loi de probabilité P, une suite (X,,...,X,) 
de variables aléatoires indépendantes et de même loi de probabilité P. On dit que P 
est la loi parente de l’échantillon. Pour tout © de Q, la réalisation correspondante de 
lPéchantillon se note (x,,...,x,), ayant posé x, = X;,(œ), 1 < i < n. Cette réalisation 
particulière étant parfois aussi appelée échantillon, on peut alors préciser dans le premier 
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cas en disant que (X,,..., X,) est un échantillon aléatoire. Si X est une v.a. de loi P, 
on dit également qu’il s’agit d’un échantillon de la variable aléatoire X. 


À partir d’un échantillon (X,,.., X,) de X, nous définirons la loi de probabilité em- 
pirique P,, qui sera la distribution uniforme sur l’ensemble fini des valeurs (X,,...,X,), 
c’est-à-dire qui attribue la même masse de probabilité 1/n à chacun des points X;, 
1 <i< n, et qui peut se noter sous la forme : 


1 n 
=, 2x 


où 6, est la masse de Dirac au point a. Aïnsi, pour tout intervalle 7 de R, sa probabilité 
est égale au pourcentage de points de l’échantillon qui appartiennent à cet intervalle : 


1 n 
E, (1) = EF À 1; (X;) 
i=1 


Cette loi de probabilité admet une fonction de répartition, notée F,, appelée fonction 
de répartition empirique et définie pour tout réel x par : 


EG= k dP,= P,(-c, x[) = : D Lost (Xi) 
= i=1 


qui représente le pourcentage de points observés qui sont situés avant x. Les va. 
n 

X,,...,X, étant indépendantes, la va. nF,(x) = Y 1.41%) suit une loi binô- 
i=1 


miale de paramètres n et F(x) puisque c’est la somme de n variables indépendantes 
de Bernoulli, de paramètre P (Lx (Xi) = 1) = P (x; (= J-0o, x[) = F(x). Ainsi : 


E [F,@)] = Fo) et V [F, @] = = FG) [1 — F(x)] — 0 quand n — co. 


ei) Moments empiriques 


La loi de probabilité empirique P, admet des moments de tous ordres que l’on nomme 
moments empiriques ou moments de l’échantillon et qui seront tous des variables 
aléatoires. 


2.1 Moyenne empirique 


La moyenne de l’échantillon aléatoire est la moyenne de la loi empirique, c’est-à-dire 
l’espérance d’une loi uniforme discrète qui affecte le même poids 1/n à chacune des 
valeurs X’; et notée : 


— 1 Ê 
Lu 
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Loi empirique 


Cette v.a. admet comme espérance : 


et comme variance : 


Ainsi, X, a la même moyenne que X, mais avec une variance qui est divisée par la 
taille de l’échantillon. Les autres moments centrés de X, ont pour expressions : 


= 3 Es 4 _ 
E(X -m) Sr 4 E(X -m) mate 
" n2 " nr nr 


2.2 Variance empirique 


La variance de la loi empirique est celle d’une loi de moyenne sa et qui attribue le 
même poids 1/n a chacune des valeurs X, soit : 


n 
2 
jo + 
s2=- > (x -X,) 
I=T 
Pour calculer les moments de cette variable aléatoire, nous allons l’exprimer à l’aide 
des v.a. centrées en écrivant X, — X, = (X; _ m) — (x _ m) 5 


n 


D(x-2,) = 3 (x -m°+n(X,-n) -2(7,-m) Ÿ (x, -n) 


i=] i=]1 i=1 


d’où on déduit : 


Ceci permet d'obtenir aisément l’espérance de ce moment empirique : 


E(s?) = EX-m°E(X,-m) =VG-V(X,) = 


La valeur moyenne de la variance empirique n’est pas exactement égale à la variance 
théorique, c’est pourquoi on introduit la variance empirique modifiée (ou corrigée) où 
on divise non pas par le nombre de termes de la somme, mais par le nombre de termes 


indépendants, puisqu'ils sont liés par la relation Y (x LE x,) = 0: 
i=l 
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on a alors E (52) = 02. Le calcul de la variance est plus délicat et on obtient : 


2) _ M n—3 4 
VS} = n n@=1" 


où 4 = E(X — m)*. Pour la variance empirique on obtient : 


(n—1ÿ 


el 


FAN = 4 n—-l 4 

— a— Lam 
Vs?) (u o)+2 = 0 
n 


n 


On peut également préciser le lien existant entre moyenne et variance empiriques par 
le calcul de la covariance : 


— Le et Cou(X,,.S?) 2 
2 n n 


Cou(X,, se) = 


Ainsi, pour toute loi symétrique, on a : Cou(X s2) = (. 


n° 


2.3 Moments empiriques 


Le moment non centré d’ordre k € N* de cette loi empirique est : 


n 
l k 
Myn = — + 
n° 
i=1 


È 
(e] 
Q 
pal 
3 
T 
Il 
pu) 
mu 
> 
| 
3 
À 
a 


V{mes) = SV (A5) = 2 [E(XE) — E(X9)] = 2 (ma = M?) 


Le moment centré d’ordre k € N* de cette loi empirique est : 


n 


Hin = , D (x = +). 


i=1 


Échantillon d'une loi normale 


Nous allons étudier le cas particulier où la v.a. X suit une loi normale N (m, o). 


La moyenne empirique étant une combinaison linéaire de v.a. normales indé- 
pendantes suit aussi une loi normale : 


en) 


La variance empirique est construite à partir des variables : 


x, -X,=- D x;+(1-°)x, 
er " 
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Loi empirique 


qui sont des combinaisons linéaires de variables normales indépendantes donc sont aussi 
des variables normales, d'espérance E (X; — X,) = E (X;) —E (X,) = 0 et de variance 
V(X;,- X,) = E(X,- ra = E(S"?) car toutes ces variables ont la même loi. 


ä 7e D & p) ë a # 
La variable ns? est la somme des carrés de n variables normales centrées qui sont liées 


par la relation X (X;— X,) = 0 et on peut démontrer que : 
i=1 


ï ” 5. ! hn — 1 s D. L à 
On retrouve bien le résultat général E(S°?) = ———06? et on obtient ici, d’après les 
n 


moments de la loi du khi-deux, v(s?) = 2168, Pour la variance empirique mo- 
n 


4 
difiée : E (52) = o?et v(s?) = 2. La loi normale étant symétrique, moyenne et 
À — 


variance empiriques sont bien entendu non corrélées, mais de plus elles sont indépen- 
dantes et c’est une propriété caractéristique de la loi normale. Ce résultat s’énonce de la 
façon suivante : 


Théorème 5.1 RES SS : 


Théorème de Fisher 


i Les va. X,,..., X, forment un échantillon d’une loi normale si et seulement si les 
È va. ra et s°? sont indépendantes. 


3.1 Loi de Student 
Nous avons vu que : 


m 
Vn—"—— +» N(0, 1) 
© 


Dans le cas où © est un paramètre inconnu, on peut le remplacer par l’écart type 
empirique modifié, ce qui amène à considérer la variable : 


Le numérateur suit une loi normale centrée réduite et le dénominateur est la racine 
carrée de la variable : 


S?  (n—1)52/0? 


o2 n—l 
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qui est donc une variable de loi AE divisée par son nombre de degrés de liberté. 
D’après le théorème de Fisher, le numérateur et le dénominateur sont des v.a. indé- 
pendantes et leur rapport définit une nouvelle loi de probabilité, usuelle en statistique, 
appelée loi de Student à r — 1 degrés de liberté. Au-delà de ce cas particulier lié à 
un échantillon gaussien, on peut définir cette loi à partir d’une v.a. U de loi N(0, 1) et 
d’une autre v.a. indépendante Y de loi de Le rapport U / VY/n suit une loi de Student à 
n degrés de liberté, notée T,. Comme le numérateur U suit une loi symétrique par rapport 
à 0, il en de même de T,, avec E(T,) = 0 pour n > 1. On obtient aussi V(T,) = —— 
pour n > 2. d 

Le cas particulier n = 1 correspond au rapport de deux variables normales indépen- 
dantes qui suit une loi de Cauchy, qui possède la particularité assez rare de n’admettre 


aucun moment. En effet, sa densité est PP le calcul de l’espérance conduit à 
z(1+x 


l'intégrale généralisée : 


LE ST 2\ 1400 
EG =? / Lane on M UEAOES 


intégrale divergente car cette quantité n’est pas définie, donc l’espérance d’une loi de 
Cauchy n’existe pas. 


3.2 Loi de Fisher-Snedecor 


En présence de deux échantillons (X,, ..., X,)et(Y,,..., Y,,) auxquels sont associées les 
variances empiriques s”? et 52, on peut se poser la question de savoir s’ils proviennent 
de deux lois normales ayant la même variance, et pour cela former le rapport 7 / 2 
Si effectivement ces deux lois ont la même variance, ce rapport de deux lois du khi-deux 
indépendantes, réduites (divisées) par leur nombre de degrés de liberté (car s’écrivant 
[U /(n — 1)]/[V/(m — D]avec U =(n-1) 52/0? et V = (m1) 5°2/0?, définit une 
nouvelle loi usuelle en statistique, appelée loi de Fisher-Snedecor. Plus généralement, 
si U et V sont deux v.a. indépendantes de lois respectives Aa et gs alors le rapport 
(U /n)/(V /m) suit une loi de Fisher-Snedecor à n et m degrés de liberté, notée F(n, m). 
On obtient comme moments : 


2m° —2 
ELF (nm = "=, m > 2 et VIF (nm = CMD à 
m—2 n(m — 2) (m—4) 
.n nm 2 
On peut remarquer que : —F(n, m) + Prr (5. =) etT + F(,n). 
m 


Les fractiles de cette loi sont tabulés (table 7) pour certains couples (n, m) ; si le 
couple (n, m) cherché ne figure pas, mais si le couple (m, n) est dans la table, on utilise 
le fait que (V/m) / (U /n) - Fm, n). 
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Exemple 5.1 
Pour « donné, cherchons le fractile f, (n, m) de F(n, m) défini par : 
a= P{F(n,m) < f,(n,m)} = P UM ee (n, m) 
, a , V/m a , 


{TR ! }=r{rmns te) 
U/n f,{n,m) f,(n,m) 


= 1- P {Fm < =) 
fa (n,m) 


on voit ainsi que 1 —a = P{F(m,n) < 1/f,,(n, m)} et par conséquent 1 /f,, (n, m) est 
le fractile f, _, (m, n), d'ordre 1 — «, de la loi F(m, n). Appliquons ceci à la recherche 
du fractile d’ordre 0,025 de la loi F(15,10), défini par : 


ns —  — 
0,025 = P{F(15,10) < 0925 (15, 10)} = P {ao TEST) } 


d’où on déduit 0,975 = P {F(10, 15) < 1/f6925 (15, 10)} ; on lit dans la table 7 la 
valeur du fractile f6 975 (10, 15) = 3,06 d’où la valeur cherchée : 


1 
15,10) = —— = 0,327. 
Lo,025 ( ) 3.06 


oO Tests d'adéquation 


L'examen de la loi de probabilité empirique associée à un échantillon dont la loi parente 
est inconnue permet de choisir parmi les lois usuelles celle qui lui « ressemble » le plus. 
Si notre choix s’oriente vers une certaine loi P de fonction de répartition (£r.) F, on 
pourra retenir l’hypothèse que l’échantillon provient de cette loi si la distance entre la fr. 
théorique F et la fr. empirique F, est faible. Ayant fait le choix d’une certaine distance 
d entre fonctions de répartition, on se fixera une règle de décision qui s’énonce ainsi : 
«Si l'événement d (F F ) < Cest réalisé, alors je retiens l’hypothèse qu'il s’agit d’un 
échantillon de la loi de fr. F ». On peut cependant se tromper en rejetant cette hypothèse 
alors que F est bien la fr. des variables de l’échantillon ; cette erreur se produit avec 
une probabilité qui est « = P {d (E,, F ) > C h Si on veut que ce risque d’erreur soit 
faible, on fixera une valeur « faible à cette probabilité (par exemple 5 % ou 1 %) et cette 
valeur permettra alors de préciser la valeur de la constante C qui apparaît dans la règle 
de décision, si on connaît la loi de probabilité de la v.a. d(F,, F). Nous aurons ainsi 
réalisé un test d’adéquation, ou d’ajustement, entre une loi théorique donnée et une loi 
empirique associée à un échantillon d’observations. La fixation du risque « déterminera 
alors la valeur du seuil d’acceptation, ou seuil critique C. 

Nous allons présenter maintenant deux tests, associés à deux distances entre f.r., per- 
mettant de déterminer la loi approchée de la v.a. d LE F ) pour toute f.r. F, le premier 
étant plutôt destiné aux lois discrètes et le second réservé aux lois continues. 
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4.1 Test du khi-deux 


Ce test est à retenir si les données sont discrètes, avec des valeurs possibles notées x;, 
de probabilité p, pour 1 < i < k, ou si les données individuelles ne sont pas fournies, 
mais ont été réparties en classes (a;, a;,,) dont les fréquences théoriques sont calculées 
à partir de la loi théorique postulée : 


P; = P{X € (a,,a,,1)} = F(a,:1) — F(a;) 


Si N; est le nombre (aléatoire) d'observations x;, ou appartenant à la classe (a, a;,;), 
nous allons le comparer à l’effectif théorique qui est np. La distance euclidienne clas- 
sique entre F,,, représentée par les k effectifs observés N,, et la fr. F, représentée par 

k 

à a à 2 

les k effectifs théoriques np,, serait Y (N 1 np;) ; 
il 

Cependant, comme cette distance ne permet pas de déterminer la loi asymptotique de 
cette v.a., on préfère retenir une autre distance. Cette dernière sera déterminée à partir 
de la remarque que les v.a. N; suivent des lois binômiales de paramètres n et p; et que 
les variables centrées (N; — np,) /\/np; convergent vers vers la loi N (0, 4/1 — p,). On 
retient donc la distance : 


et cette somme de carrés de v.a. centrées qui sont asymptotiquement normales et liées 


k 
par la relation X (N; — np,) = 0 converge vers une loi y?_.. La valeur de C est alors 
il 


déterminée approximativement, en utilisant cette loi asymptotique, comme le fractile 
d’ordre 1 — « de la loi du khi-deux à k — 1 degrés de liberté. Cette approximation est 
justifiée si n est assez grand et p, pas trop petit, avec comme règle empirique np, > 5. 
Si ce n’est pas le cas à cause d’une valeur de p, trop petite on doit regrouper des classes 
(ou des valeurs) contiguës. Pour le calcul de la distance, il est préférable d’utiliser la 
formule développée : 


N2 


d(F,.F) = ” Dh 


i=1 np; 


Exemple 5.2 

Ayant demandé à dix personnes de fournir chacune dix chiffres choisis au hasard, 
on souhaite savoir si effectivement les cent chiffres obtenus forment bien une distri- 
bution au hasard. L'hypothèse à tester ici est donc celle d’une loi uniforme discrète 
sur l’ensemble des dix chiffres {0, 1, ,9}, donc avec des probabilités égales pour 
chacune de ces valeurs, p;, = 1/10 pour i = 0, 1, ,9. Le tableau ci-après contient la 
distribution empirique (observée) sur la deuxième ligne et la distribution théorique 
sur la troisième. 
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Loi empirique 


10 8 9 14 8 9 11 9 12 10 


np; | 10 10 10 10 10 10 10 10 10 10 


On obtient comme distance : 
d(F,F) = DH 0+4+1416+44 1444 14440) = 3,2 


le fractile d’ordre 0,95 de la loi du khi-deux à neuf degrés de liberté est C = 16,9 
donc la valeur de la distance est très inférieure et on peut accepter l’hypothèse d’une 
répartition uniforme. 


Cependant, dans beaucoup de cas, si le type de loi est précisé, la loi dépend de para- 
mètres dont la valeur n’est pas spécifiée et qu’il va falloir estimer pour pouvoir calculer 
les fréquences théoriques p;. Si on doit estimer r paramètres, cela diminue d’autant le 
nombre de degrés de liberté qui devient alors k — 1 —r. 


Exemple 5.3 

On a observé pendant deux heures le nombre de voitures arrivées par minute à un 
poste de péage. Si X est la v.a. représentant le nombre de voitures arrivant dans 
une minute à ce poste de péage, on fait l'hypothèse qu’elle suit une loi de Poisson. 
Le tableau ci-après contient les valeurs observées x; de cette variable et le nombre 
d'observations correspondantes N;. Pour calculer les probabilités théoriques p, = 
P(X = x;) il faut spécifier complétement la loi, c’est-à-dire indiquer le paramètre de 
cette loi de Poisson. Le calcul de la moyenne empirique donne x = 3,7 et la variance 
empirique a pour valeur 4,41. On retient alors la valeur entière 4 comme paramètre 
de cette loi de Poisson. Les valeurs de np, sont alors obtenues par lecture de la table 4 
et arrondies à l’entier le plus proche, en vérifiant bien que le total est égal à n = 120; 
par exemple nP(X = 3) = 120 x 0,1954 = 23,448 est arrondi à 23. 


4 9 24 25 22 18 6 5 3 2 1 


np, | 2 9 18 23 23 19 13 7 3 2 1 O0 


Les valeurs des effectifs théoriques inférieures à 5 nécessitent de regrouper les deux 
premières et les quatre dernières valeurs, ramenant à 8 le nombre de valeurs retenues, 
soit 8 — 1 — 1 = 6 degrés de liberté puisqu’un paramètre a été estimé. Le fractile 
d’ordre 0,95 de la loi du khi-deux à 6 degrés de liberté est € = 12,6. On obtient 
d(F,F) = 7,14 ce qui conduit donc à accepter l’hypothèse que X suit une loi de 
Poisson de paramètre 4. 
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4.2 Test de Kolmogorov-Smirnov 


Dans le cas d’une variable continue pour laquelle on dispose des données individuelles, 
il est préférable d’utiliser toute l’information disponible et de ne pas regrouper les ob- 
servations en classes. On retient alors la distance de Kolmogorov, ou distance de la 
convergence uniforme, définie par : 


K,=d(F,,F) = sup|F, (x - F()| 
xER 


Là encore, on retiendra l’hypothèse que la loi parente admet F comme fr. si cette 
distance est faible, c’est-à-dire plus précisément si l’événement d(F,F) < C est réalisé. 
La valeur de C sera déterminée par la fixation du risque d’erreur « = P{d(F,, F) > C} 
et en utilisant la loi limite de la va. VrK, qui admet pour f.r. la fonction K définie pour 


x > Opar: 
+00 (ce) 
K(x) = > CA) e 26 x = 1 _ 2 > (0 e 2x 
k=—00 k=1 


Les valeurs de K sont tabulées, permettant de déterminer les fractiles de la loi. Les 
valeurs de C sont données en fonction de « dans la table suivante : 


n æ=0,10 | a=0,05 | a =0,01 
5 0,509 0,563 0,669 
10 0,369 0,409 0,486 
15 0,304 0,338 0,404 
20 0,265 0,294 0,352 
25 0,238 0,264 0,317 
30 0,218 0,242 0,290 
40 0,189 0,210 0,252 
n>40 | 1,22/4n | 1,36/4/n | 1,63//n 


Pour le calcul pratique de cette distance, on utilise la définition de F, faisant intervenir 
l'échantillon ordonné X,, < X4,, < .… < X,,,. L'expression de F, (x) = P,{]-0o, x[} 
s'écrit alors : 


0 si x<X(, 
i—1 


FE, (x) = Si XG1n<X<X 
1 si x>X, 


On calcule au préalable les statistiques : 


” 1 
a+ (6,7) sep [R@ FO = px (à = F(Xo)] 


d” (F, E,) = Sup [FG) —F, 69] = max À F(X() à — } 


xEeR 
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Loi empirique 


car F, est constante sur chacun des intervalles délimités par les points de l’échantillon 


ordonné : 
i . i 
SUP FE, @x) — F(x) = inf F)=--F X,;, +0 
xE] XX] NX x<XG+n n ( (0) ) 
i 
=--F(X, 
n ( w) 


On calcule ensuite : 


d(F,F)=max{d*(F,F),d*(F,F,)} 


Exemple 5.4 


On se pose la question de savoir si les données suivantes peuvent provenir d’une loi 
normale centrée et réduite : 

6, 42; —5,23; —1,25; 0, 12; —0,01; —1,02; 18, 54; 0,06; —7, 64; 2, 85; —1, 84; 0,74; 
—0,65; 0,24 

Disposant des données individuelles, nous allons utiliser le test de Kolmogorov- 
Smirnov et pour cela ordonner les observations par valeurs croissantes x, puis 
calculer les valeurs ® (xw) à l’aide de la fr. ® de la loi N(0, 1). Les valeurs per- 
mettant le calcul de la distance entre loi empirique et loi théorique figurent dans le 
tableau suivant : 


x | PC) | 5x) | P(xo)- — 
— 7,64 0 0,0667 0 
— 5,23 0 0,1333 — 0,0667 
— 1,84 | 0,0329 0,1671 — 0, 1004 
—1,25 | 0,1056 0,1611 — 0,0944 
—1,02 | 0,1539 0,1794 — 0,1128 
—0,65 | 0,2578 0,1422 — 0,0755 
—0,01 | 0,4960 | —0,0293 0,0960 
0,06 0,5239 0,009 0,0572 
0,12 0,5478 0,0616 0,0145 
0,24 0,5948 0,0719 — 0,005 
0,74 0,7704 | —0,0371 0,1037 
2,18 0,9854 | —0,1854 0,2521 
2,85 0,9978 | —0,1311 0,1978 
6,42 1 — 0,0667 0,1333 
18,54 1 0 0,0667 
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On lit dans les deux dernières colonnes du tableau les valeurs maximales 
d*(F,,F) = 0,1794 et d* (F,F,) = 0,2521 d’où on déduit d(F,, F) = 0,2521. 
Pour un risque « = 0,10 on lit dans la table 5.1, pour n = 15, le seuil critique 
C = 0,304 donc on accepte l’hypothèse d’une loi parente N(0, 1), bien que la valeur 
de la distance soit proche du seuil de rejet de cette hypothèse. 


© Compléments 


5.1 Statistique d'ordre 


La statistique d’ordre associe à un échantillon (X,,... , X,) d’une loi de fr. F et de den- 
sité f, les observations classées ordre croissant : X4,, < .… < X,,,. Elle a pour densité : 


nl. Ce x) [[G) 
i=]l 


où C, = {(x1,...,x,)/x, << x, }. 

Les valeurs extrêmes sont X,,,, de fr. définie par G; (x) = 1—[1-F (x)]", de densité 
8x) = nf(x)[1 - F1", et X(w de fr. définie par G,(x) = F"(x), de densité 
89) = nf (x) FT (x). 

La loi de l’étendue (range) W,, = X,,,—X (1, se déduit de la loi du couple (Xa» X(» ) ; 
de fr. définie pour x < y par : 


GC y) = EF") - FO) - FG)r 


au moyen du changement de variable x = x et = y — x. On obtient comme f:r. pour 
w > D: 


H(w) = n [ir + w) — FG)]" 1 f(x)dx 
R 
et comme densité : 


hGwo) = n(n — 1) fire + w) = FO" 2 f(x + w)f(x)dx 
R 


Si le support de la loi est R, l’expression des fr. des valeurs extrêmes montre que : 


X — —co et X(n) — +00 
p.co. P.Co. 


Si le support est l'intervalle (a, b) on obtient de même : 


XAa, — a et X4, — b 
P.Co. P.co. 
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Loi empirique 
Si la loi admet une espérance, on établit également que : 


np np 
(voir le chapitre 6 pour la définition de ces convergences). 


Pour obtenir la loi de X,,,, 1 < k < n, il suffit de remarquer que le nombre N,(x) de 
variables de l’échantillon qui sont inférieures au réel x vérifie : 


NO Z2kSX EG, <X 


Comme N, (x) - B(n, F(x)) on en déduit la fr. G, de X4, définie par : 
n 
GG = Y ( : ) FiGIL — FO" 
ik \ 
et sa densité peut être obtenue de façon « intuitive » comme probabilité qu’un élément 
de l’échantillon soit compris entre x et x + dx, soit f(x), que k — 1 soient situés avant 
x, soit FT (x), que n — k soient situés après x, soit [1 — F(x)]"-#, avec un nombre de 
permutations n! des variables de l’échantillon qui doit être divisé par le nombre (k—1)! 
de variables avant et (n — k) ! de variables après, soit : 


n! 
&GY= NE) GI — FOX FX) 


On peut également exprimer la f.r. de X,,, au moyen de l'intégrale bêta incomplète : 


1 ee k-—1 k 
CD — (1 = "Ed 
mr 7e 5/ Ke 


et retrouver ainsi par dérivation l’expression de la densité. 


En utilisant le résultat de l’exercice 2.13 qui a montré que F(X) U([0, 1]) et en 
faisant le changement de variable y = F(x), on établit alors que : 


FX) + Bon k+ 1). 


5.2 Théorème de Fisher 


À partir d’un échantillon de n v.a. de la loi N(0, 1), on construit le vecteur X de co- 
ordonnées (X,,...,X,) dans la base canonique (e,, .…. ,e,) de R”. Sa projection sur le 
vecteur bissecteur u = (1,...,1) est le vecteur X = (&, zs ,X,). Si on effectue un 
changement de base orthonormée au moyen de la matrice orthogonale P, en choisissant 


se u 
dans la nouvelle base (f,,.., f,) le vecteur unitaire f, = ——, le vecteur des nouvelles 
n 


coordonnées de X est Y ='PX,avec Y, = VnX,. 
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On obtient ainsi : 


n 


n-]l n 
X-XEX = Dr = Xe Vnx, Ye 
j=1 i=1 V/n i=1 
=Y(x-X,)e 
i=1 


D'autre part : 


V(Y)=V(PX)='PV(X)P = 'PP=I, 


CE | r-"52 
donc Y, est indépendant de Y,,...,Y,_, et par conséquent de Y Fe = x — X | = 
j=1 


n 


'\2 —= n = \2 
> (x — x,) , ce qui établit l’indépendance de X, avec Y (x - x,) et le fait que 
i=1 i=1 


cette dernière variable suit la loi pe > Comme somme des carrés des n — 1 variables 
Y,,...,Ÿ,_, qui sont indépendantes et de même loi N(0, 1). 
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L'essentiel @ 


[1] Un échantillon d'une loi P, ou d'une va. X, est un ensemble de v.a. 
indépendantes et de même loi P, ou de même loi que la v.a. X. 


_— ne >: de Le 
@ 1: loi uniforme qui attribue la même probabilité — à chacune des n ob- 
n 


servations d'un échantillon est appelée loi empirique et ses moments,  : 
moments empiriques. On étudie plus particulièrement la moyenne et  : 
la variance empiriques. Les moments empiriques sont des fonctions 
de l'échantillon, donc à ce titre sont aussi des v.a. qui admettent des 
moments théoriques. 


® À partir de la fonction de répartition empirique on peut effectuer untest 
permettant de savoir si on peut retenir pour le modèle théorique une 
certaine loi de probabilité donnée. Dans le cas de données discrètes 
ou regroupées en classes, on utilise comme test d'ajustement le test du 
khi-deux. Pour des données individuelles issues d’une loi continue, ilest  : 
préférable d'utiliser le test d'adéquation de Kolmogorov-Smirnov. É 
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(@) Entrainez-vous 
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5.1 
5.2 
5.3 


5.4 


5.5 


5.6 


5.7 


Déterminer les fractiles d’ordres 0,90 et 0,05 de la loi de Student Ts. 
Déterminer le fractile d’ordre 0,05 de la loi de Fisher-Snedecor F(30, 20). 


Le tableau ci-après contient les fréquences absolues N; d'apparition des entiers x; de O0 
à 9 dans les 10 000 premiers chiffres de la partie décimale du nombre x. On demande 
de tester l’hypothèse d’une répartition uniforme de ces entiers. 


x 0 1 2 3 4 5 6 7 8 9 


N;, | 968 1025 1021 974 1014 1045 1021 970 948 1014 


Pour vérifier si un ensemble de deux dés n’est pas truqué, on les jette 108 fois. La 
somme des chiffres obtenus a pris les valeurs 6, 9 et 11 respectivement 12, 15 et 8 fois. 
Peut-on accepter l’hypothèse de l’équilibre de ces dés, en prenant comme risque de 
première espèce a = 0,05? 

Le tableau ci-après fournit la distribution du nombre X d’accidents graves par semaine 
à un carrefour dangereux, relevés pendant une certaine période. On demande de tester 
l’hypothèse que la loi parente de X est une loi de Poisson de paramètre À = 2. 


Xi 


N. 


! 


Un organisme de défense des consommateurs a prélevé au hasard 200 boîtes de 
conserve de haricots verts pour tester la validité de l’étiquetage indiquant un poids 
net égoutté de 560 g. La distribution observée du poids égoutté X en grammes figure 
dans le tableau suivant : 


X N; 
[530,540[ | 14 
[540,545[ | 15 
[545,550[ | 29 
[550,555[ | 40 
[555,560[ | 37 
[560,565[ | 27 
[565,570[ | 20 
[570,580[ | 18 


On demande de tester l'hypothèse que X suit une loi N (555,10). 

Peut-on accepter l’hypothèse que les données suivantes proviennent d’une loi 
N (15;1)? 

2,51 ; 1,45 ; 0,71 ; 0,25 ; 2,35 ; 0,00 ; 2,06; 1,95 ; 0,41 ; 2,75 ; 0,78 ; 1,01 ; 1,75 ; 2,32; 
1,36. 


@ 5.1 
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5.2 


5.3 


5.4 


5.5 


Solutions © 


La table 6 fournit la valeur 1,316 dans la colonne 0,90 et, du fait de la symétrie de cette 
loi, le fractile d’ordre 0,05 est obtenu dans la colonne 0,95 en changeant le signe, soit 
—1,708. 


La table 7 ne comporte pas le couple de degrés de liberté (30, 20) mais comporte le 
couple (20, 30) ; nous allons voir comment nous y ramener. Par définition, la loi F(n, m) 


X/n 
est la loi du rapport U = + où X et Y suivent des lois du khi-deux à respectivement 
m 
è se: : 1 Y/m ; | 
n et m degrés de liberté. Par conséquent = x 7 suit une loi de Fisher-Snedecor 
n 


F(m, n). La valeur 4 cherchée est définie par : 0,05 = P(U <u) = P(1/U > 1/u), 
avec U de loi F(30, 20), ou P(1/U < 1/u) = 0,95 donc 1 /u est le fractile d’ordre 0,95 
de la loi F(20, 30), valeur lue dans la table 7, soit 1 /u = 1,93 et u = 0,518. 


Si la répartition des entiers est uniforme, chaque entier x; a la même probabilité 
Pi = 1/10 et tous les effectifs théoriques ont la même valeur np; = 1000. On calcule la 
distance du khi-deux d(F,, F) = 9,37 que l’on compare au seuil critique € = 16, 92 as- 
socié au risque à = 0,05. Même pour un risque plus élevé « = 0, 10 le fractile d’ordre 
0,90 de la loi # est C = 14,68 et on accepte encore l’hypothèse d’une répartition 
uniforme de ces entiers. 


Tester l’équilibre de cet ensemble de deux dés revient à tester l’adéquation de la loi 
empirique avec la loi théorique en cas d’équilibre. Comme seulement trois valeurs 
de la somme ,S sont données, on va regrouper toutes les autres valeurs possibles. 
Les 4 valeurs théoriques retenues sont donc : 


5 4 2 
Pi (S = 6) 36" P2 (S = 9) 36 75 QS ) 36” 
25 


= | — _ — = — 
Pa PP PT 
On peut donc constituer le tableau de comparaison des distributions empirique et 
théorique : 


np; | 15 12 6 75 


La distance entre ces deux distributions a pour valeur : 
D, - (12 — 15Ÿ ” (15 — 12Ÿ ” (8-6)? ” (73 — 75} _ 
15 12 6 75 
Le fractile d’ordre 0,95 de la loi du khi-deux à 4 — 1 = 3 degrés de liberté a pour valeur 
7,8 donc on accepte l’hypothèse de l’équilibre de ces dés, en prenant comme risque de 
première espèce a = 0,05. 


2,07 


On calcule les effectifs théoriques np; arrondis à partir des probabilités de la loi de 
Poisson P (2). Pour obtenir des effectifs suffisants on doit regrouper les deux dernières 
classes ; on obtient le tableau suivant : 
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5.6 


5.7 


0 1 2 3  4ouplus 


On obtient d(F,,, F) = 1,49 valeur qui est inférieure au fractile d’ordre 0,95 de la loi 
1. qui vaut C = 9,49 donc on accepte l’hypothèse que ces observations forment un 
échantillon d’une loi de Poisson P (2). 


Les données étant regroupées en classes, on effectue le test du khi-deux en calculant 
les effectifs théoriques np, où n = 200 et p;, = P(X € [a,,a;,, |) se calcule à partir de 
la fr. ® de la loi N(0, 1) en centrant et réduisant les observations. Par exemple : 

5 > X—555 10 


= D(1) - = 0,14 
10 10 no) Œ QI QERSS 


P (560 < X < 565) = P( 


et 200 X 0, 1498 = 29, 96 est arrondi à 30. Les classes extrêmes [530,540[ et [570,580 
sont assimilées respectivement aux classe]—co, 540[ et [570,+oo. 


Le calcul de la distance du khi-deux se fait à partir du tableau suivant : 


X N; | np 


[530,540[ | 14 13 
[540,545[ | 15 | 18,5 
[545,550[ | 29 | 30 
[550,555[ | 40 | 38,5 
[555,560[ | 37 | 38,5 
[560,565[ | 27 30 
[565,570[ | 20 | 18,5 


[570,580[ | 18 13 


On obtient d(F,,F) = 3,23 que l’on compare au fractile d'ordre 0,95 de la loi PA 
qui vaut C = 14,07. On accepte donc l’hypothèse de données provenant d’une loi 
N(555, 10), donc d’une loi dont la moyenne est inférieure de 5 g à la valeur indiquée 
sur la boîte. 


Disposant des données individuelles, nous allons utiliser le test de Kolmogorov- 
Smirnov et pour cela ordonner les observations par valeurs croissantes x,;, puis calculer 
les valeurs centrées (et réduites) u4;, = x() — 1,5 pour pouvoir calculer ensuite ® (u(;,) 
à l’aide de la fr. © de la loi N(0, 1). Les valeurs permettant le calcul de la distance 
entre loi empirique et loi théorique figurent dans le tableau suivant : 
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Î 
= 7 P(u) 


i-1 


Du) - — 


n 


CT) D(u) 
1,5 | 0,0668 
1,25 | 0,1056 
1,09 | 0,1379 
0,79 | 0,2148 
0,72 | 0,2358 
0,49 | 0,3121 
0,14 | 0,4443 
0,05 0,4801 
0,25 0,5987 
0,45 0,6736 
0,56 0,7123 
0,82 0,7939 
1,01 0,8438 
1,25 0,8944 
1,45 0,9265 


— 0,0001 
0,0277 
0,0621 
0,0519 
0,0976 
0,0879 
0,0224 
0,0532 

0,001 
— 0,007 
0,0210 

0,006 
0,0229 
0,0389 
0,0735 


0,0668 
—0,1611 
0,004 
0,0148 
— 0,0309 
— 0,0212 
0,0443 
0,0134 
0,0654 
0,0736 
0,0456 
0,0606 
0,0438 
0,0277 
— 0,007 


Loi empirique 


On lit sur les deux dernières colonnes du tableau les valeurs maximales d'Ÿ(F,, F) = 
0,0976 et d'(F,F,) = 0,0736 d’où on déduit d(F,,F) = 0,0976. Pour un risque 
a = 0,10 on lit dans la table p. 154, pour n = 15 le seuil critique C = 0, 304 donc 
on accepte l’hypothèse d’une loi parente N(1,5; 1), la distance obtenue étant beaucoup 


plus faible que le seuil critique. 
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Comportement 
asymptotique 


À la convergence des lois usuelles. ? ? Théorème central limite 


en Introduction CPEPTEEEEELCEEEEECEELEECLEECEELEECEECCEECEECEEECEECEECEECCEECEECEECCEETEECEECCEECEECEECCEECEECEECOEETES .. 


La taille d'un échantillon et la quantité d'information apportée par celui-ci sont bien sûr 
liées, de telle sorte que, si cette taille augmente, l'information sur la loi parente P de 
X augmente aussi, ce qui doit se traduire par une plus grande « proximité » entre la loi 
empirique P, et la loi théorique P. Cette notion intuitive de plus grande proximité d'un 
terme d'une suite aléatoire, avec un terme fixe, aléatoire ou non, demande à être traduite 
et définie de façon rigoureuse. 


Nous allons donc étudier dans ce chapitre le comportement asymptotique d'une suite de 
va. X1,..., Xn quand n devient infini. Nous définirons la convergence en probabilité et 
la convergence en loi. Nous évoquerons aussi la convergence en moyenne quadratique 
car elle implique la convergence en probabilité et est généralement plus facile à établir 
que cette dernière. À ces deux types principaux de convergence seront associés les deux 
théorèmes fondamentaux de la statistique asymptotique, la loi des grands nombres et le 
théorème central limite. 


CEPPETECEC EEE TELE EE EE ELEC ELEC EE EEE ELEC EEE EEE EEE EEE EEE EEE EEE EEE EE EEE EEE CEE EEECE EEE E EEE EEE EEE .… 


S Objectifs CECEPCEECEPCECCEPEEEECEPCEPDEEEEEEPEYE ï. - CET ÉPCECLELEEEEECEEEEEEEEES . 


MÉNNED les deux théorèmes È Convergence en probabilité et en 
fondamentaux de la statistique ? ? moyenne quadratique Ë 
asymptotique, la loi des grands È ? Loi des grands nombres É 


nombres et le théorème central limite. Convergence en loi 


@ Convergence en probabilité 


La définition de la convergence en probabilité fait intervenir une suite numérique de 
probabilités dont la convergence sera souvent établie grâce à l’inégalité de Bienaymé- 
Tchebychev qui lie une probabilité et une variance. Avant de donner la définition de 
cette convergence stochastique et d’en étudier les propriétés, nous allons donc au préa- 
lable présenter quelques inégalités qui seront utiles par la suite dans l’établissement de 
certaines de ces propriétés. 
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1.1 Inégalité de Markov 


Si X est une v.a. positive dont l’espérance existe, l’inégalité de Markov établit que pour 
tout À > 0: 
E(X) 


PIX > AEQ) < > où P(X > À < 


On peut remarquer que sous sa première forme cette inégalité est sans intérêt pour 
À < 1 puisqu’alors le majorant de la probabilité est supérieur à un. Cette inégalité pré- 
sente bien sûr essentiellement un intérêt théorique, utile pour certaines démonstrations ; 
sa portée pratique est limitée par sa généralité, le majorant étant indépendant de la loi, 
sa valeur numérique sera souvent très supérieure à la valeur exacte de la probabilité. 


Exemple 6.1 

Pour À = 2 l'inégalité de Markov s’écrit P(X > 2E(X)) < 0,5; dans le cas parti- 
culier de la loi exponentielle € (1) on obtient P(X > 2) = e? = 0,135, valeur très 
sensiblement inférieure au majorant. 


Dans le cas d’une v.a. de signe quelconque, on adapte la seconde forme de l’inégalité 


de Markov en l’appliquant à |X{X, pour tout k tel que E|X|f existe : 


EIX|* 
À 


On introduit alors un nombre € > 0 tel que £* = 1 et on en déduit pour tout € > 0: 


P (IX 2 4) < 


EIX| 
£k 


P(IXI>e)< 


1.2 Inégalité de Bienaymé-Tchebychev 


On obtient l’inégalité de Bienaymé-Tchebychev en appliquant l'inégalité de Markov 
sous sa dernière forme, à la v.a. X — E(X) pour k = 2, donc pour une variable dont la 
variance existe, soit pour tout € > O fixé : 


V (x) 
e2 


P(IX — E(X)I > #)< 


REMARQUE Cette inégalité relie la probabilité pour X de s’écarter de sa moyenne 
E(X), à sa variance qui est justement un indicateur de dispersion autour de la moyenne 
de la loi. En choisissant £ = 6 (X) = 4/V(X), on obtient P{|X — E(X)| > o(X)} <1 
et cette inégalité est donc sans intérêt pour € < o(X). On peut écrire cette inégalité pour 
la variable centrée-réduite en prenant cette fois € = ao(X) avec a > 1: 


P (fe >a)< 2 
o(X) a? 
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Exemple 6.2 


Dans le cas particulier de la loi N(m, o), la valeur exacte de la probabilité se calcule 
par P(IX — m| > ao) = 1 — P([U] < a) = 1 — [D(a) — P(-a)] = 2[1 — D(a)] 
où U est une v.a. de loi N (0, 1) et de f:r. D. Pour a = 1,5 on obtient comme valeur 
2 X 0,0668 = 0,1336 alors que le majorant a pour valeur 4/9 = 0,444, valeur bien 
supérieure. Cet exemple montre à nouveau que la portée pratique d’une telle inégalité 
est faible, mais qu’elle sera très utile pour la démonstration de certaines propriétés, 
étant établie pour un très grand ensemble de lois de probabilité. 


1.3 Inégalité de Jensen 


Si g est une fonction réelle convexe sur un intervalle 1 de R (.e. g(ax + (1 — a)y) < 
ag(x) + (1 — «)g(y) pour tous x et y de T et tout « € [0,1], ou g”” (x) > 0 si g est deux 
fois dérivable) qui contient X(Q), ensemble des valeurs possibles pour la va. X, telle 
que E(X) et E[g(X)] existent, alors : 


gLE(XII < Elg(X)] 


L’ordonnée (au sens de la fonction g) de la moyenne (au sens d’espérance) est plus 
petite que la moyenne des ordonnées. 


Exemple 6.3 

Si on applique cette inégalité à g(f) = f? on obtient E?(X) < E(X?), ré- 
sultat bien connu par ailleurs puisqu'il traduit que la variance est positive : 
V(X) = E(X?) - EX) > 0. 


1.4 Convergence en probabilité 


Si (X,) est une suite de v.a. qui converge vers une v.a. X, cela signifie que X, se « rap- 
proche » de X quand n augmente. On mesure la distance entre X, et X par |X, — X| 
qui sera d’autant plus petite que n sera grand ; mais, s’agissant de v.a., il faut considérer 
l'événement |[X, — X| < € qui sera réalisé avec une probabilité d’autant plus élevée 
que n sera grand. On va donc associer à la suite aléatoire (X,,) la suite numérique des 
probabilités de ces événements, qui devra converger vers un. Ceci conduit à la définition 
suivante. 


a) Définition 


On dit que la suite de v.a. (X,) converge en probabilité vers une v.a. X si, pour tout 
€ > 0: 


P(IX,-X|<Ee)—1 quand n 0 
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ou, de façon équivalente : 
P(IX,-X|>Ee)—0 quand no 


On écrit : 


Exemple 6.4 


Soit (U,) une suite de v.a. indépendantes, de même loi uniforme sur [0,1]; on lui 
associe la suite (X,) définie pour tout entier n par X, = min{U,,...,U,}. Nous 
allons établir que : 


X,—0 quand n— 
P 


Pour cela, nous allons calculer, pour un € > 0 fixé, la probabilité P(|X,| > €) qui est 
égale à P(X, > €) puisque X, est une variable positive. Cette dernière probabilité 
est nulle pour £ > 1, donc il suffit de considérer le cas € < 1. Toutes les v.a. U, étant 
indépendantes, de même loi que U avec P(U < x) = x pour 0 < x < 1, on obtient : 


P(IX,| >) -r{Qu 2) = 
i=1 


=(1-Ee)  — 0 


P(U, > e)=[1- P(U <e)} 
i=1 


qui exprime bien que (X,,) converge en probabilité vers 0. 


b) Conditions suffisantes de convergence en probabilité 


Dans l’exemple 6.4 précédent, on a pu établir sans trop de difficultés la convergence de la 
suite (X,), à partir de la définition. Cependant, pour des lois plus complexes il peut être 
difficile d’obtenir l’expression de la probabilité permettant d’établir cette convergence. 
Nous allons maintenant fournir un moyen plus simple de démontrer cette convergence, 
à partir des deux premiers moments de X,,. 


Théorème 6.1 Re eeeeeeeeeeen seen eee eee eee 


È Si(X,) est une suite de v.a. telle que : 
E(X,) -— a 
V(X,,) — 0 
quand ñn — co, alors : 
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En fait, on peut énoncer un résultat plus général que celui qui s’applique à la conver- 
gence vers un nombre réel a en l’appliquant à la suite (Y,,) définie par Y, = X,—X, avec 


(X,) qui converge vers la v.a. X, puisque Y, ne 0& X, Fe X. Les conditions suffisantes 


pour la suite (X,,) deviennent alors : 


E(X,-X)—0 
FX = XX) 50 


quand n — co, et impliquent : 


Exemple 6.5 

Nous avons vu dans le chapitre précédent que pour tout x réel fixé on avait ETF, (x)] = 
F(x) et VIF,(x)] = F(x)I1 — F(x)]/n — 0, donc ces conditions suffisantes per- 
mettent d'établir la convergence ponctuelle de la fonction de répartition empirique 
vers la fonction de répartition théorique : 


F,(x) e F(x). 


En réalité, on peut établir qu’il existe une constante universelle C telle que : 
P {sn LF,@) — FG)| > e} LCe 
xER 


Cette probabilité converge donc vers 0 pour tout £ > 0, mais en plus très rapidement 
puisqu'elle est majorée par le terme général d’une série convergente. Il y a donc 
convergence uniforme de la fr. empirique vers la fr. théorique, selon un mode 
plus fort qu’en probabilité. On peut énoncer la forme affaiblie du théorème de 
Glivenko-Cantelli : 


sup |F,(x) — F(x)| — 0 
xEeR P 


De cette convergence forte de la loi empirique vers la loi théorique découlent toutes 
les propriétés de convergence des moments empiriques associés à cette loi. 


c) Convergence en moyenne d'ordre p 


Les conditions suffisantes énoncées précédemment permettent en fait d’établir une 
convergence plus forte que la convergence en probabilité, qui est la convergence en 
moyenne quadratique, cas particulier de la convergence en moyenne d’ordre p que nous 
définissons pour cette raison. 
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DÉFINITION 


On dit que la suite de v.a. (X,) converge en moyenne d'ordre p, avec 0 < p < , 
vers la v.a. X si: 


EIX, — XP — 0 quand no 
On écrit : 


= X 
Mp 


Dans le cas particulier p = 2, la convergence en moyenne d’ordre 2 s’appelle conver- 
gence en moyenne quadratique. En écrivant E(X,-—X) = V(X,-X)+E?(X,-X) 
qui est la somme de deux termes positifs, on retrouve les conditions suffisantes de 
convergence en probabilité comme conditions nécessaires de convergence en moyenne 
quadratique : 


X,-X<e 


m.q. 


EX 2%) +0 
V(X, = X) = 0 


Pour toute valeur de p > 0, la convergence en moyenne d’ordre p est plus forte que 
la convergence en probabilité, au sens où : 


X,=X=xX,-xX 
Mp p 
et donc en particulier : 


X,-X>X,-xX 


m.q. p 


Très souvent, on établit donc la convergence en moyenne quadratique pour obtenir 
la convergence en probabilité, car cela se ramène à l’étude de la convergence de deux 
suites numériques, généralement simple à effectuer. 


d) Théorème de Slutsky 


Théorème 6.2 EETEEEEEEEEEEEEEEETEEEEEEEEEeE encens " 


Si f est une application réelle continue, alors : 
X,—=X = f(X,) - f(X) 
P P 


LCPPPECECEP EE EEE ELEC EEE EEE EEE EEE EEE EEE EEE EEE EEE EEE EEE EE EECECECEECEECECECENE EEE EEE EEE EE EE EEE EEEPEET LS 


Ce théorème exprime donc qu’une application continue conserve la convergence en 
probabilité, au sens où la limite de la suite des images est l’image de la limite de la suite. 
Ce résultat se généralise en deux dimensions sous la forme du théorème suivant. 
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Théorème 6.3 eee eee eeeeeeee eee ee : 


Si f est une application de R? dans R uniformément continue et si (X ,) et Œ,) sont 
: deux suites de v.a. qui convergent en probabilité respectivement vers les v.a. 
i X et Y, alors: 


f (XV) > AY) 


. 
LCPPTECECEP EEE ELEC ELEC ELEC ELEC EEE EEE ELEC EEE CEE EEE EETECECENEECEEECEECEEECCETEECEEEC EEE ET EEE EEE EEE EEE CEE LS 


Si on applique ce théorème aux fonctions f définies respectivement par 


f GU,v) = u+u,f(u,v) = uv et fu) = À, de X,—X et Y,—Y on 
U P P 


X 
déduit respectivement X, + Y,—X +Y,X,Y,-— XY et FA _— à condition que 
p p p 
P(Y =0)=0. 


n 


1.5 Loi des grands nombres 


Dans le chapitre précédent, nous avions vu que la moyenne empirique d’un échantillon 
d’une v.a. X avait même moyenne, au sens d'espérance mathématique, m que X, mais 
avec une dispersion, mesurée par la variance, beaucoup plus faible, de valeur o?/n, 
c’est-à-dire que la variance de X était divisée par la taille de l’échantillon. Ainsi, quand 
n devient infini, cette variance tend vers zéro, assurant la convergence de la moyenne em- 
pirique vers la moyenne théorique E(X) = m. Ce résultat s’obtient à partir de l’inégalité 
de Bienaymé-Tchebychev, puisque pour tout € > 0: 


v(x,) ; 

—— n Lx 

P([X,-m>e)< = =T 0 
€ NE 


ce qui permet d’énoncer le premier théorème fondamental de la statistique asymptotique, 
c’est-à-dire quand la taille de l’échantillon devient infinie. 


Théorème 6.4 - SÉCCEEEEEEEEETENEEEETEENENEEET EEE eee eee eee eee eee EEE é 


Si (X,) est une suite de v.a. mutuellement indépendantes qui admettent les mêmes 
É moments d’ordres un et deux, c’est-à-dire avec pour tout entier n, 
E(X,) = met V(X,) = o?, alors quand n — © : 


X,—m 
P 


Ce théorème est obtenu sous la condition que les v.a. X, aient mêmes moments 
d'ordres un et deux, mais pas forcément même loi, et s’appelle parfois loi faible des 
grands nombres. Il existe en effet une loi forte des grands nombres, relative à une conver- 
gence plus forte que nous n’étudierons pas ici (voir compléments), qui peut s’obtenir 
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plus logiquement sous la seule condition d’existence du moment d’ordre un, puis- 
qu’elle concerne seulement le moment d’ordre un, mais en renforçant par ailleurs les 
hypothèses, en supposant alors que les v.a. X, ont la même loi de probabilité. 


Exemple 6.6 
Théorème de Bernoulli 


On effectue n expériences successives indépendantes où on s’intéresse à chaque fois 
à la réalisation d’un certain événement À. On associe donc à chaque expérience i, 
1<i<n,une variable de Bernoulli : 


1 p 
X. = 
‘ g=1-p 


La fréquence empirique, c’est-à-dire le pourcentage de réalisations de À est : 
1 n 
F n : 2 X iT X n 
i= 


avec E(f,) = pet V(f,) = pq/n, d'où en appliquant l’inégalité de Bienaymé- 
Tchebychev, pour tout € > 0 : 


Pq 
P —pl>e)<—-0 
(lf pl ES 
ce qui établit que pour ñn — c : 
ne LA 


c’est-à-dire que la fréquence empirique (observée) d’un événement converge, en pro- 
babilité, vers la fréquence théorique ou probabilité de réalisation de cet événement 
quand le nombre d’expériences augmente indéfiniment. Ce résultat, connu sous le 
nom de théorème de Bernoulli, établit donc le lien entre l’expérience que l’on peut 
avoir des chances de réalisation d’un événement et la définition théorique que l’on a 
donnée de sa probabilité. Nous verrons dans le chapitre 7 suivant que la fréquence 
empirique fournit une estimation de la probabilité d’un événement. 


(à) Convergence en loi 


2.1 Définition 


DÉFINITION 


On dit que la suite de v.a. (X,), de f.r. F,, converge en loi vers une v.a. X de f.r. F si 
la suite {F,(x} converge vers F(x) en tout point x où F est continue ; on écrit alors : 


X,—X 


loi 
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Les v.a. X, ont toutes des lois différentes, de f.r. notées F,, à ne pas confondre avec 
la f.r. empirique associée à un échantillon de v.a. qui ont toutes la même loi, donc la 
même f.r. 


2.2 Lien avec la convergence en probabilité 


Le lien entre les deux convergences que nous venons de définir est précisé par le résultat 
suivant. 


Théorème 6.5 IECEETEECEEEEEEEEEEEESEETEETEE Eee esse essences eee eee . 


? La convergence en probabilité d’une suite (X,,) implique sa convergence en loi : 


Ce résultat se conçoit intuitivement car F,(x) représente la probabilité, associée à la 
loi de X,, de l'événement { X, < x}, et elle va converger vers la probabilité correspon- 
dante associée à la loi de X. La réciproque de ce résultat est fausse en général, mais est 
vraie dans le cas particulier où la limite est une v.a. certaine X = a, c’est-à-dire quand 
la loi limite est une loi de Dirac, loi dégénérée concentrée en un seul point. 


2.3 Propriété 
Si (X,) et (Y,,) sont deux suites de v.a. telles que pour n — co : 
X, X et Y, a 
où a est un nombre réel, alors : 
X,+Y, = X+a 
X,Y,—aX 


loi 


X, X 
2 — si 0 
Y, bi à ar 


2.4 Théorème de Slutsky 


Théorème 6.6 - SÉEEEEEEEEETEEETEEETEEEEEESEEESEeeene encens seseseceee ETES . 


i Si g est une application réelle continue, alors : 


X,>X > 8 (X,) > 8x) 
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2.5 Conditions suffisantes de convergence en loi 


Dans le cas d’une loi discrète ou d’une loi absolument continue, on peut énoncer des 
conditions suffisantes de convergence en loi relatives aux probabilités individuelles ou 
à la densité qui définissent ces lois. 


Dans le cas discret où X,(Q) = X(Q) = {a,/iel}: 
VIEI,P(X,=a)-P(X=a)=X,>X, n > 00 


Dans le cas où X, et X admettent pour densités respectives f, et f : 


Vx ER, f,(x) — f(x) À, > 2x, n — © 
ol 


2.6 Théorème central limite 


La loi des grands nombres énonce la convergence de la suite X, des moyennes empi- 
riques vers la moyenne théorique m, c’est-à-dire une v.a. certaine ou loi de Dirac, loi 
dégénérée dont toute la masse est concentrée en un point. Si on équilibre la suite des 
v.a. centrées et réduites (X, — m) /o, qui converge vers zéro, par V/n qui tend vers 
l'infini, la forme indéterminée obtenue aura une limite qui sera celle d’une loi non dé- 
générée cette fois, la loi normale. C’est ce qu’énonce le théorème central limite, dont 
nous donnons ici l’une des multiples versions. 


Théorème 6.7 ÉXEREEEEEEEEETEEErEEEEEENEEec essences eee encens eee ees rec eeeeeEETRE : 


? Si (X,) est une suite de v.a. indépendantes et de même loi, admettant des moments 
d'ordres un et deux notés m = E(X,) et o? = V(X,), alors: 


C’est en raison de ce théorème que la loi normale est la loi de probabilité la plus 
utilisée en statistique. En effet, beaucoup de phénomènes individuels ne sont pas symé- 
triques et donc ne peuvent pas être modélisés par la loi normale. Mais, dans beaucoup 
de situations, le phénomène étudié est la résultante d’un grand nombre de composantes 
indépendantes et le théorème central limite nous assure alors que la loi normale est tout 
à fait adéquate. 


2.7 Limite d'une suite image 


Nous savons qu’une application continue transporte la convergence en loi (théorème de 
Slutsky, $ 2.4) ; nous allons préciser ce résultat dans le cas d’une convergence vers la loi 
normale, comme celle obtenue par le théorème central limite. Si une suite de v.a. (X,) 
converge vers un nombre réel fixé m, avec une suite numérique (a,) convenablement 
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choisie qui tend vers l’infini avec n on peut obtenir la convergence en loi de la suite 
a, (X,, — m) vers une loi normale centrée. La suite (g(X,,)) sera alors centrée sur g(m) et 
équilibrée aussi par a, pour converger vers une loi normale centrée dont l’écart type sera 
modifié. Voici l’énoncé précis de cette propriété permettant de transporter un résultat 
de convergence en loi. 


Théorème 6.8 ÉEEEEEEEETEEECEEEEEEEEEEETEEN Een esse ee eee eee EEE . 


? Si la suite (X,) est telle que : 


n 


a (X,-m) > N(0,0), n — oo 


? avec a, — œeto > 0, alors si g est une application réelle dérivable, la suite (g(X,)) É 


| converge aussi en loi avec : 
a, [8 (X,) — g@n)] = NO, 01g'(m)l). n — co 


LEPEPECEP EE TEL ELITE ELEC EL EE EE TEL EL ELEC EL EEE EC EEE EE ELEC EE EEE EEE ECC EEE EEE EEE ESC EEE TETE ET EEE CEE EEE CEE EE ELEC EEE CETTE TRS 


2.8 Convergence des moments empiriques 


a) Moyenne empirique 


Les deux théorèmes fondamentaux de la statistique asymptotique établissent la conver- 
gence en probabilité et en loi de la moyenne empirique. 


b) Variance empirique 
Au chapitre précédent, nous avons obtenu comme expression de la variance empirique : 
s?= Due (x -m) 
NN | 
en ayant posé U, = (X,—m). De la loi des grands nombres on déduit U, . E(U) = 6°? 
et (x, _ m) — 0 et par conséquent : 


P 


2 
S’ = 6?, n — © 
mp 


On obtient bien sûr le même résultat pour S° = nS" « /@— 71) puisque n/(n—1) — 1. 


En appliquant la loi des grands nombres et le théorème central limite on obtient : 


X,-m—0 et V(X,-m)= N (0) 
P loi 
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= 2 
ce qui implique d’après la propriété $ 2.3 que Vi(X,-m) 7 0. Ainsi, 


V/n (s é S c?) a même loi limite que V/n (U, — 2), qui est obtenue par le théorème 
central limite avec E(U) = 0? = 1 et V(U) = u4 — ui ; 


Vi(sè-0) 2 N (ou). n = © 


On a le même résultat pour S?. 


c) Moments empiriques 
Par application de la loi des grands nombres : 


1 n 
Myn = n Xi > E(X*) = My 
i=1 


On obtient par ailleurs V (X k) = My — m° donc par application du théorème central 
limite à la suite (XX) : 


Nr = N(0. 1) 
p) ot 


My co me 


2.9 Convergence des lois usuelles 


a) Loi binômiale 


Soit X une v.a. de loi B(n, p) et supposons que n — co. Nous allons considérer deux cas 
suivant que le second paramètre p reste fixe ou tend vers 0 avec 1 /n. 


e Sip — 0 quand n — oc, avec np — À fini, alors en utilisant la formule de Stirling 
n! = n'e"\/2xn(1 +€,), on montre que pour tout entier k fixé, 0 <k<n: 


PX =D = ( : }#a-n) se 


ce qui, d’après la condition suffisante (cf. $ 2.5) de convergence en loi, établit que la 
loi binômiale B(n, p) converge vers la loi de Poisson P (4). C’est pourquoi on appelle 
parfois la loi de Poisson loi des événements rares, puisqu'elle correspond à des 
événements de probabilité très faible, mais que l’on observe quand même en raison 
d’un très grand nombre d’épreuves, comme par exemple le nombre d’erreurs dans un 
livre ou le nombre d’accidents à un carrefour. On considère que l’approximation est 
valable pour n > 30 et np < 5. 
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Exemple 6.7 

Pour p = 0,1 et n = 30 on lit dans la table 3 de la loi binômiale P(X = 1) = 
0,1413. Si on utilise la variable Y de loi de Poisson de paramètre np = 3 on lit 
P(Y = 1) = 0,1494 dans la table 4, donc valeur très proche. 


e Si p reste fixe quand n — oc, on utilise l’approximation normale en écrivant la loi 
binômiale comme somme de v.a. X,; indépendantes et de même loi de Bernoulli de 


paramètre p: X = Y X;. Comme E(X,;) = pet V(X;) = pq on déduit du théorème 
i=1 
central limite : 


/p loi 


Avec Fe = X /n, ceci peut encore s’écrire : 
AIR =D SDS PE AL à pee _X np. 
pq NA npq mi 


On peut donc approximer la loi binômiale B(n, p) par la loi normale N'(np, \/npq). 
On considère que l’approximation est valable pour n > 30, np > S et nq >5. 


N(O, 1) 


Exemple 6.8 
On lance 400 fois une pièce de monnaie et on veut calculer la probabilité que 
la fréquence d’apparition de pile soit comprise entre 0,45 et 0,55. On associe à 
chaque lancer i, 1 < i < n, la v.a. de Bernoulli : 
x. = 1 pile(1/2) 

7 |O face(1/2) 

400 

La variable S = Y X; suit une loi binômiale B(400, 1/2) avec E(S) = 200, 


i=1 
VS) = 100 et o(S) = 10. La probabilité demandée s’écrit : 


P (0, 45< DS <0, 55) — P(180 < S < 220) 
( 20 > S — 200 | <=) 

10 10 10 
et peut être approximée à l’aide de la f:r. ® de la loi N(0, 1) par D(2) — D(—2) = 
2(2) — 1 = 0,9544. Pour n = 900 on obtient E(S) = 450, V(S) = 225 et 
o(S) = 15 et la rt demandée devient : 


P (0. 45 EE 55) = P(405 < S < 495) 
6 < 


(- 4 S — 450 È 45 =) 
TA 15 15 
qui est approximée cette fois par 2(3) — 1 = 0,9973. 
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b) Loi hypergéométrique 


Si X suit une loi hypergéométrique de paramètres N , net N, avec N — œet N,/N = 
p qui reste fixe, on obtient par la formule de Stirling, pour tout k fixé tel que 0 <k < n: 


eo 
my 6 


Il y a donc convergence de cette loi hypergéométrique vers la loi binômiale B(n, p). 


P(X = k) = ) pp" 


L’approximation est considérée comme justifiée lorsque le rapport n/N, appelé parfois 
taux de sondage, est inférieur à 10 %. 


c) Loi de Poisson 


Si X suit une loi de Poisson dont le paramètre À tend vers l’infini, alors : 


ER 
V2 loi 
Exemple 6.9 
Pour À = 16 on lit dans la table de la loi de Poisson P(X < 21) = 0,9107. On 


ae :) par d(1,25) = 0, 8944, où Destlafr. 
16 


de la loi N(0, 1), soit une assez bonne approximation malgré une valeur faible de À. 


approxime P(X < 21) = P 


Correction de continuité Nous avons ici un second exemple d’une loi discrète qui est 

approximée par une loi continue. Si X est une variable à valeurs entières dont la loi est 

approximée par celle de la variable continue U, on ne peut pas approximer p,=P(X=k) 

par P(U = k) = 0! On remplace donc cette probabilité par la valeur approchée 

P(k— 1/2 < U < k+ 1/2) qui est la probabilité de l’intervalle de longueur un qui 
k 


contient l’entier k. Ainsi, P(X < k) = Y P(X = j) va être approximé par : 
j=0 


P(U <k+1/2)= P(U -1/2<k) 


L’approximation de la loi discrète de X par celle continue de U impose donc de rempla- 
cer X par U — 1/2 dans les événements exprimés à partir de X, ce qu’on appelle faire la 
correction de continuité. Dans l’exemple 6.9 précédent, P(X < 21) doit donc être ap- 
proximé par P(U — 1/2 < 21) = (5, 5/4) = 0,9154 soit une meilleure approximation 
que sans la correction de continuité. 


178 


© Dunod — Toute reproduction non autorisée est un délit. 


Comportement asymptotique 


d) Loi gamma 


Si X suit une loi y(p) avec p — co, alors : 


X —p 


VP 


= NO, 1) 


e) Loi du khi-deux 


Si X suit une loi du khi-deux dont le nombre de degrés de liberté v — oc, alors : 


=D SN D 
20 loi 


Cependant, pour les petites valeurs de v, on obtient une meilleure approximation en 
utilisant comme résultat la convergence : 


V2X - V20-1= N(0.1) 


Exemple 6.10 


Le fractile d’ordre 0,1 de la loi du khi-deux à 50 degrés de liberté a pour valeur 
u = 37,7 (cf. table 5). Avec la première approximation, on écrit : 


nie XV uv 
20 20 
Le fractile d’ordre 0,1 de la loi N(0, 1) a pour valeur f = —1,2816 d’où on déduit 


comme valeur approchée de u : 10f +v = 50—12,8 = 37,2. Pour utiliser la seconde 
approximation, on écrit : 


01=P(V2X- V2v-1 < Vau- 2-1) 


et on obtient cette fois V2u — V2v — 1 = f soitu æ 37,6 valeur plus proche de la 
valeur exacte. 


f) Loi de Student 
Si X suit une loi de Student dont le nombre de degrés de liberté n devient infini, alors : 


À > N(0,1) 
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Exemple 6.11 

Pour se faire une idée de l’approximation du fractile d’ordre 0,95 par celui de la 
loi normale qui vaut 1,645 le tableau ci-après donne les fractiles exacts de la loi de 
Student en fonction de n. 


n 30 40 100 200 500 
1,697 | 1,684 | 1,660 | 1,653 | 1,648 


Compléments 


Nous allons présenter deux autres modes stochastiques de convergence, plus forts que 
la convergence en probabilité, et nous énoncerons notamment la loi forte des grands 
nombres. 
3.1 Convergence presque sûre 
On dit que la suite (X,) converge presque sûrement vers la v.a. X si : 
P {o E Q/lim X,(&) = X()} =i 

n 

et on écrit : 
X,—X, ho 
P.s. 
Cette terminologie, qui peut paraître un peu étrange, traduit le fait que la suite nu- 

mérique X,(æ) converge presque partout vers X(w), au sens où elle converge pour 
tout © de Q, à l’exception d’un sous-ensemble de Q dont la probabilité est égale à 


zéro. Les quatre propriétés suivantes, qui sont équivalentes, peuvent permettre de mieux 
comprendre le sens de cette convergence : 


X,— X 


P.S. 


Ÿ 


Ve > 0, im P {sup[X — Xe } =0 
# m>n 
Ve > 0, im P Ÿ 


Ve > O0, im P Ÿ 
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Il est facile de voir que les événements suivants sont équivalents : 
U (IX, -X1> €) = {snix, - X|> e} 
m>n m>n 

et ont comme complémentaire : 

(IX, -Xx1<e) 
m>n 


ce qui montre l’équivalence des trois conditions. La dernière condition exprime que, à 
partir d’un certain rang N = N(Ee), tous les événements (|X, — X| < €) pour n > N 
sont réalisés avec une probabilité qui tend vers un. La première condition signifie que : 


sup[X, — X] 0, n — © 


m>n 
et implique en particulier que | X, — X|— 0, donc la convergence presque sûre est plus 
p 


forte que la convergence en probabilité : 


X,-=X=xX,-xX 


PS. P 


à titre d'illustration de cette convergence, nous pouvons énoncer le théorème suivant. 


Loi forte des grands nombres 


Théorème 6.9 - HEEEEEEErEEEEEEENT EEE EEEnrere Essen eee eee eee ETES : 


Si (X,) est une suite de v.a. indépendantes et de même loi, admettant une espérance 
i notée m, alors : 


3.2 Convergence presque complète 


La convergence précédente peut être difficile à établir; cependant, si on applique 
l'inégalité de Boole, on observe que : 


PAUJ(IX,-Xx|>e) < SP -xl>e) 


m>n m=n 


et donc la convergence presque sûre sera obtenue si la série de terme général 
P{IX,-X| > €} est convergente, car le majorant est le reste de cette série. Cette condi- 
tion suffisante de convergence p.s., plus facile à établir que les conditions équivalentes 
de la définition, sert de définition à une convergence plus forte. 


On dit que la suite (X,) converge presque complétement sûrement vers la v.a. X si : 


Ve > 0, D'P{IX,-X|>E} < +00 


n=1l 


181 


Statistique et probabilités 


et on écrit : 


X,— X, no 
p.co. 


A titre d'illustration de cette convergence, nous pouvons énoncer le théorème suivant, 
énoncé sous sa forme faible dans l’exemple 6.5. 


Théorème 6.10 SRE enreereee eee seen eee . 


: Théorème de Glivenko-Cantelli 
Si F, est la f.r. empirique associée à un échantillon d’une loi de fr. F, alors : 


sup [F,(x) — F(x)| — 0, n — 
xeR pP.Co. 


Exemple 6.12 


Considérons la suite (X,) définie à partir d’une v.a. U de loi uniforme sur [0,1] par : 


; 1 
n Si U<- 
X,= vn . on ,n>l 
0 sinon 


et étudions sa convergence vers zéro. Pour tout £ > 0 fixé, l’événement ([X > €) 


Gin Nr 1 
est équivalent à l'événement U € Lo. =], donc : 
m 


Üuxu>o={U(ue Lo. =])=(u e Lo. =]) 


et par conséquent : 


n 


P Üux,1> 0 =p{uelo-|)==-0 


ce qui traduit le fait que : 


X,—0 
Ps. 
Cependant, P(IX,| > €) = P (u < =) = : est le terme général d’une série di- 
n n 


vergente et donc il n’y a pas convergence presque complète de (X,) vers zéro. Cet 
exemple montre bien que ces deux convergences ne sont pas équivalentes, même si 
dans beaucoup de cas la convergence p.s. se démontre à partir de la convergence p.co. 
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L'essentiel @ 


@ |! sst bien sûr essentiel de retenir les énoncés des deux théorèmes fon- 
damentaux de la statistique asymptotique : la loi des grands nombres et 
le théorème central limite. Ceci suppose au préalable de bien connaître  : 
également les définitions des deux convergences principales associées 
à ces théorèmes : la convergence en probabilité et la convergence en É 
loi. E 


@ 1: convergence en probabilité est plus forte que la convergence en loi: 
et se démontre généralement à partir des conditions suffisantes qui font 
intervenir l'espérance et la variance des termes de la suite. Ces condi- 
tions définissent en fait la convergence en moyenne quadratique, qui à 
son tour implique la convergence en probabilité. 


(3 ) L'inégalité de Bienaymé-Tchebychev est utile pour établir certains résul- 
tats théoriques. 


. Ô 
LCEPEPEETEL EEE CEE EEE CELL EE LEE CELL EEE ET ELEC EEE EE TETE EEE TETE ELEC EEE EEE EE EE EE EEE EEE EEE CEE EEE EN EEEPEE EE TETE EEE CEE ELEC EEE TEEN EEE EE TRS 
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6.1 


6.2 


6.3 


6.4 
6.5 


6.6 


6.7 


6.8 


Étudier la convergence en probabilité, en moyenne, puis en moyenne quadratique de la 
suite de v.a. (X,) dont la loi de probabilité est définie pour n € N* par : 


PO =D PO ne et PO =D= 1-2 
2n2 n2 


Soit (X,) une suite de v.a. dont la loi est définie pour n € N* par : 


PX=0= 1-7 et PX,= => 


1. Montrer que (X,) converge en probabilité, mais pas en moyenne quadratique, vers 
zéro quand n tend vers l’infini. 


2. Soit (Ÿ,,) une suite de v.a. de même loi N(0, 1) etindépendantes des v.a. (X,,). Étudier 
la convergence en loi de Z, = X,+ Y, et la imite de V(Z,) quand n tend vers l’infini. 


Peut-on appliquer la loi des grands nombres à la suite (X,) de v.a. mutuellement 
indépendantes dont la loi de probabilité est définie pour n € N* par : 


P(x,=-Vn)=P(x,= Vn)=37 


Etudier la convergence en loi de la suite de v.a. certaines X, = n. 


Soit (U,) des va. indépendantes et de même loi définie par P(U, = 1) = pet 
P(U, = -1) = q = 1 — p avec O0 < p < 1. Déterminer la loi exacte, puis la loi 
limite, de la suite (},) définie par : 


n 
v,=[[0 
i=1 


Soit (X,) une suite de v.a. de loi géométrique de paramètre p, = —, où 0 est un 
n 


: ee. + : 
nombre strictement positif. Montrer que la suite —® converge vers la loi exponentielle 
n 


de paramètre 0. 


Soit (X,) une suite de va. de loi uniforme discrète sur l’ensemble X,(Q) — 


1 n-]1 ; se 
{0. Es ,l }. Montrer que cette suite converge vers la loi uniforme sur [0,1]. 
n n 


Soit (X,) une suite de v. a. dont la loi est définie pour n € N* par: 


P(x,=1-<)=P(x;=1+2)2=5 
h 4) 


Etudier sa convergence en loi. 
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6.10 


6.11 


6.12 


6.13 
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Calculer le fractile d’ordre 0,95 de la loi à en utilisant l’approximation de la loi de 


1/2 F — V2v — 1 par la loi normale standard, avec ici v = 40. 


Soit X, une v.a. positive de densité f,(x) = ne "* 


(X,) converge en moyenne quadratique vers zéro. 


pour x > 0. Montrer que la suite 


Soit (X,) une suite de v.a. indépendantes et de même loi, de densité f définie par : 
—(x—0) 
e six > 0 
F0 { 0 six < 0 


où 0 est un nombre positif fixé. Montrer que m, = min{X,,.….,X,} converge en 
moyenne quadratique vers 0. Etudier la convergence en loi de Y, = n(m, — 6). 


Soit (X,) une suite de v. a. indépendantes et de même loi normale centrée et de 
variance o2. Étudier la convergence en loi des v. a. : 


n n 
D,==Y x; et s2=1Y x? 
LE] = 


Soit (X,) une suite de v.a. mutuellement indépendantes et de même loi de Gum- 
bel de densité f(x) = exp(x — e*). Déterminer la loi de probabilité de la variable 
aléatoire Z, —= er, puis étudier la convergence en loi de la suite (Y,), avec 


n 
1 | 
Y, = nl De) 
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e Solutions 


6.1 


6.2 


6.3 


6.4 


6.5 


Pour tout € > 0, on obtient P(IX,| < €) = P(X, = 0) = 1 -— L — 1 quand n — ©, 
n 


donc par définition X,, — 0. D'autre part, E(|X,|) = è — 0 ce qui exprime que X, 
P n 
converge en moyenne (d'ordre 1) vers zéro, ce qui implique d’ailleurs sa convergence 
en probabilité. Enfin, E (X2) = ] donc X, ne converge pas en moyenne quadratique 
Vers ZÉrO. 
1. Pour tout £ > 0, P(IX,| > €) = P(X, = n) = L — 0 quand n — co, donc par 
n 


définition de la convergence en probabilité : 
X,—0 
P 


Par ailleurs, E (XE) = n*°1 donc E(X,)=1eE (X*) — co pour tout entier k > 1. 
En particulier E (Xe) — oæ et donc (X,) ne converge pas en moyenne quadratique 
vers zéro. Aucun moment de X, ne converge d’ailleurs vers le moment correspondant 
de sa limite qui est toujours égal à 0. 

2. Toutes les variables Y, ont la même loi N (0, 1) qu’une certaine variable Y, donc en 
appliquant la propriété présentée $ 2.3 on en déduit que la suite (X, + Y,,) converge en 
loi vers Y. Cependant, V(Z,) = V(X,) + V(Y,) = n — 1+1=n — o, alors que Z, 
converge en loi vers la loi normale de variance 1. 


On ne peut pas appliquer la loi forte des grands nombres aux variables X, car elles 
n’ont pas la même loi. D’autre part, on obtient E(X,) = 0 et V(X,,) = n donc on ne 
peut pas non plus appliquer la loi faible des grands nombres car ces variables n’ont pas 
la même variance. 


Les variables X,, ont pour fr. : 
0 six<n 
F = 
rx) { 1 sin<x 


La suite F,(x) converge pour tout x réel vers F(x) = 0; cependant il n’y a pas 
convergence en loi car F n’est pas une fonction de répartition. 


La va. V, étant le produit de termes qui valent 1 ou — 1 ne prend aussi que les valeurs 
l'et- 1. Si nous posons p, = P(V, = 1) on obtient E(V,) = p, — (1 — p,) = 2p, — 1. 
D'autre part, les v.a. U, étant indépendantes : 


E(v,)=[[EU)=[[C-0=c0-1" 
i=1 i=l 


et par conséquent p, = ; [1 + 2(p — A], Puisque 0 < p < 1, on a aussi [2p — 1| <1 


donc p, — 5 quand ñn — co. Ainsi la suite (V,,) converge en loi vers la va. V dont la 


loi est définie par P(V = 1) = P(V = —1) = 
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X 
6.6 La fonction de répartition de Y, = —" est définie pour tout x > 0 par : 
n 


[nx] 


BG = P (1, <x) = P(X, <nx) = Da (i-) = 1 (1-2) 


si nx € N, avec dans ce cas nx = [nx] + « où 0 < a < 1; on a alors : 


In [1- EG] = Erxlin (1 L 2) re (-£ a. =) + fx 


Sinx € N, alors : 
nx-—1 


FC) = P(Y,<x)=P(X,<nx)= D p,G-p,) 1=1-(-p,)"! 
k=1 
et : 


+ Ên 
mi F,60] = (mx Din(1-2) = x = 1) (-2 +2) + -6x 
n 
Aünsi, dans tous les cas, pour x > 0 et quand n — © : 
F0 1-67 


la limite est la fonction de répartition sur R. de la loi exponentielle de paramètre 6, qui 
est donc la loi limite de Y,. 


6.7 La fonction de répartition de X, est définie par : 


0 six <0 


Fed r. ere SR pere 
n+l n n 

1 sil < x 
Pour x < Ooux > lonaF,(x) = F(x) où F est la fonction de répartition de la 
loi uniforme sur [0,1]. Examinons maintenant le cas où x € [0, 1] et soit k l’entier tel 


que 


k : : ‘ ; 
< x < —. La fonction F étant strictement croissante : 
n 


F(—) < F(x) < F(£) soit CAE 


On obtient ainsi : 


l < F(x) < 


Se 


k__k k k—1 
=<F F —— — 
n INDE TAERS n+l n 


OU : 
k n+1—k 
eo nn Sep 


Donc, pour 1<k<n: 


cn ne Ga CE 


ce qui établit que F,,(x) — F(x) — 0 quand n — et donc que X, converge vers la loi 
uniforme sur [0,1]. 
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6.8 


6.9 


6.10 


6.11 


188 


Pour tout £ > 0 il existe un entier N = N(E) tel que pour n > Non ait l/n <eet 
alors : 
re astate 
2 "2 
Donc P(IX, — 1] < €) — 1 quand ñn — ce qui montre que la suite (X,) converge 
en probabilité vers la v. a. certaine X = 1, et donc aussi en loi puisque la limite est une 
constante. 


Cependant, P(X, = 1) = 0 pour tout entier n et donc P(X, = 1) — 0 quand ñn — 
alors que P(X = 1) = 1. Il faut donc faire attention à l’utilisation des conditions 
suffisantes de convergence en loi vues au $ 2.5. 


La lecture de la table 5 nous donne la valeur exacte du fractile d’ordre 0,95 de la loi Le 
soit x = 55,76. Cependant, beaucoup de tables de fractiles de la loi du de s’arrêtent 
à y = 30 et donc, pour un nombre plus élevé de degrés de liberté, il faut alors utiliser 
l’approximation proposée dans ces tables, soit : 


POX < x) = 0,95 = P(V2X - Vau-1 < V2x- Viv-1) 
2 @(V2x- V20-1) 


où ® est la fr. de la loi N(0, 1). Par lecture de la table 2 des fractiles on obtient 
V2x — V2u—-1 = 1,6449, soit avec ici y = 40 : x = 55,47, valeur assez proche 
de la valeur exacte. 


Pour montrer que (X,) converge en moyenne quadratique vers zéro, il faut étudier la 
limite de : 


+00 


+00 
E (Xi) = | x2ne "*dx = [2e] +2/ xe x 


—nx 1 +00 +oo 
= [-2x$ | + | e "*dx = ae 0 
n 0 0 


n n2 


ce qui exprime par définition que : 


X, — 0 


m.q. 


Il faut d’abord déterminer la loi de probabilité de m, : 


n 


n 
P(m, > x) -r{( >} = ][P(xX>x)=0-F@7 
i=1 i=1 
où F est la f.r. commune des variables X, ; ainsi, m, admet pour fr. : 

G@=1-[11-FG@ 


et pour densité : 


809 = A1 — F GI Go) = ne" 0-8) 
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pour x > 0. On calcule alors : 


2 +00 1 +co 
E(m,—0) = . (x — 0}ne "9x = / ve dy 
0 0 


n 
O2 
n? n2 
et par conséquent on en conclut que pour ñ — © : 
my Le 
La fr. de Y, est définie par : 
H,O)=P(Y,<y)=P(m,-0<2)=6,(0+2) 
n n 


et sa densité est donc : 
1 y - 
h,O= 28, (8+2)=e7 
pour y > 0, c’est-à-dire que Y, suit la loi exponentielle de paramètre 1, indépendante 
de n, et qui est donc aussi la loi limite de Y,.. 


Dans les deux cas, il s’agit d’une moyenne de v. a. qui vérifie les hypothèses du théorème 
central limite. Il nous suffit donc de calculer les deux premiers moments de ces v. a. On 
a d’abord : 


+00 +oo 
E(IXN) = | ’ Ixle "2 dx = 2 / e "du = 1/2 
oV2x /-œ 7 J0 # 


Et ensuite : 


V(XD = E (X?) - EXIX) = (1 - 2) 62 


L'application du théorème central limite permet donc d’obtenir : 


D, — AVE 
1 ——"" > N(0,1) 
/ 5 loi 
(o} 1 — A 


On a ensuite E(X?) = 6? et comme X?/6? suit une loi 7? on a aussi V(X?) = 26“. 
Ainsi : à ; 
Sc 
Vn —— N(0,1) 


o2V2 loi 


X 


On vérifie d’abord que les v.a. Z, = er suivent une loi 7(1). Nous appliquons ensuite 
le théorème central-limite à ces variables dont espérance et variance valent 1 : 


vr(Z,- 1) = N(0,1) 


La suite étudiée est définie par Y, = —In A et on utilise alors la propriété 2.7 avec 
dy = Vn et g(f) = —Inf qui nous permet d’obtenir : 


VnY, = N(0,1) 
loi 
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Chapitre | . 
Estimation 


Le problème qui va se poser au statisticien peut s'énoncer de la façon suivante : disposant 


d'observations x1, ..., x, d'une certaine v.a. X associée au phénomène étudié, obtenues 
à partir d'expériences aléatoires identiques et indépendantes, quelle loi théorique P in- 


? connue peut-on retenir comme loi parente, c'est-à-dire, quelle est la loi de probabilité 
associée à ce phénomène de production des données ? Ce qu'on peut symboliser sous la  : 
forme suivante : 


XqierXn + P? | 


Compte tenu d'informations a priori dont il dispose, le statisticien va restreindre son choix  : 
à une famille donnée (P,; 0 € O) indexée par 0 parcourant un ensemble @ bien déterminé. 
È On suppose donc ici que la loi de probabilité est parfaitement déterminée par la donnée 
d'un ou plusieurs nombres (@ € R ou ® © R!) représenté(s) par 0 que nous appellerons 
paramètre de la distribution. Nous ferons l'hypothèse que pour 8 £ 8’ on a P, # Py. : 
Le problème initial du statisticien peut alors se reformuler sous la forme symbolique 
suivante : 


Xi Xn > 07? 


et se nomme alors un problème d'estimation. Choisir une seule valeur du paramètre 9 est  : 
un problème d'estimation ponctuelle, choisir un sous-ensemble de @, dénommé région 
de confiance, est un problème d'estimation ensembliste, d'estimation par intervalle dans 
È le cas particulier, assez fréquent, ou cette région est un intervalle de R. 


se" Objectifs PA Concepts clés | FPPPEETEEE EEE EEE TEE NEEN .. 


MES comment on peut, à partir  {  Biais d'un estimateur ; 

: n s F z - à : 
Ë d'observations indépendantes,  }  Estimateur convergent E 
î attribuer une valeur, ou un ensemble i À Erreur quadratique moyenne È 
E de valeurs, à un (ou plusieurs) ÿ oi ne. | 
; : : Efficacité ; 
paramètres. ? : 


: ? Méthode du maximum 
Ë les principales propriétés d'un ; ! de vraisemblance et méthode 
Ë estimateur. i : des moments 


RCETECEECELEL EEE LEE EEE CELEL EEE TELE EEE EEE EEE ECC EE EEE EUECT SSSR CCOECOOEEPEP EEE EEE EEE EEE EEE CEE ELEC EE CET EEE EE LS 


© Dunod — Toute reproduction non autorisée est un délit. 


Statistique et probabilités 


192 


() Définition d'un estimateur 


Nous allons introduire la notion d’estimateur à partir d’un exemple familier issu des 
sondages qui, régulièrement, cherchent à connaître l’état de l’opinion publique vis-à-vis 
du président de la République. Le modèle statistique que l’on peut construire consiste 
à retenir comme ensemble @ l’ensemble des électeurs français et à considérer le sous- 
ensemble À de ceux qui sont favorables au président de la République. La v.a. X associée 
sera alors la variable indicatrice de À, définie par : 


1 SE À 
X = 
Le { O0 sinon 


La loi de probabilité de X est donc connue, c’est la loi de Bernoulli B (1, p), et le 
paramètre qui définit complètement le modèle est ici 0 = p = P(X = 1) = P(A). 
La famille de lois de probabilité est donc { B(1, p) ; p € [0, 1]} indexée par @ = [0,1]. 
Pour se faire une « idée » de la vraie valeur de ce paramètre, on effectue un sondage 
en interrogeant n personnes tirées au hasard dans @ et on associe à chacune d’elles une 
variable de Bernoulli X,,1 < i < n, de même loi que X. 

Sans être statisticien, si on constate que 48 % des personnes interrogées sont favo- 
rables au président de la République, on en déduira qu'environ un Français sur deux y 
est favorable. En langage courant, on dira que l’on « estime » la valeur de p à 48 %. Cette 
valeur, calculée sur l’échantillon, est une estimation, cette fois en terme statistique, du 
paramètre p, obtenue à partir de la fréquence empirique f, = . >, À; qu’on appellera 
donc un estimateur de p. 

Prenons un autre exemple. Supposons qu’avant de choisir un véhicule automobile 
on se fixe un critère de choix basé sur le nombre moyen N de pannes par an que l’on 
est susceptible d’avoir avec un modèle donné. Ayant la possibilité de faire une étude 
statistique chez un concessionnaire, on prélève au hasard n dossiers de véhicules et on 
note pour chacun le nombre N;,1 <i < n, de pannes subies la dernière année de mise 
en circulation. La loi de Poisson étant adaptée pour modéliser le nombre de pannes, 
on retient ici la famille de lois {P (0); 0 € R, }. Le paramètre est ici la moyenne de la 
loi, 1.e. 0 = E(N), donc on estime sa valeur par la moyenne des valeurs observées sur 
l'échantillon, soit : 


Dans ces deux exemples, on a donc construit un modèle statistique où la v.a. X suit 
une loi P, et pour se faire une idée de la valeur inconnue du paramètre 8 qui détermine 
la loi de probabilité, on utilise un échantillon de cette loi. 


A partir des valeurs observées x,, x, on calcule ensuite une certaine valeur nu- 
mérique que l’on considérera comme une valeur approchée de 8 et qu’on appellera une 
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estimation de 9. La règle qui permettra d’effectuer ce calcul est un estimateur, dont la 
définition précise est la suivante. 


DÉFINITION 


Un estimateur de @ est une application T, de FE” dans F qui à un échantillon 
(X,.… , X,) de la loi P, associe une variable aléatoire réelle (ou plusieurs dans le cas 
d'un paramètre multidimensionnel) dont on peut déterminer la loi de probabilité. 


Il s’agit d’un modèle paramétrique où E = X(Q) est l’ensemble des valeurs possibles 
pour la v.a. X, le paramètre @ étant à valeur(s) réelle(s) (F CR ou F € R#). 


La loi de la v.a. T, (X,,..., X,) dépend de celle de X, et donc de 8, et chaque réalisa- 
tion T,, (x,,...,X,) Sera une estimation de 8. Cette définition est extrêmement générale 
et ne donne pas de méthode de construction d’un estimateur. Cependant, comme nous 
l'avons vu sur les exemples introductifs, l’expression de l’estimateur découle très na- 
turellement de l’interprétation que l’on peut très souvent donner du paramètre. Nous 
avions dans ces exemples 9 = E(X), c’est-à-dire la moyenne théorique de la loi, et on 
retient donc très logiquement comme estimateur du paramètre 0 la moyenne empirique 
ou moyenne de l’échantillon : 


Ce n’est que dans certains cas, assez rares, où le paramètre n’admet pas d’interpréta- 
tion évidente, que l’on est amené à utiliser une méthode de construction d’un estimateur, 
comme la méthode des moments, généralisant cette méthode intuitive, ou d’autres mé- 
thodes aux propriétés voisines, comme la méthode du maximum de vraisemblance et la 
méthode des moindres carrés. 

Un estimateur est une statistique particulière, en tant que fonction de l’échantillon, 
qui permet d’attribuer une valeur au paramètre 8 à estimer. On pourrait donc le dé- 
finir comme une statistique à valeurs dans @. Comme nous n’avons ici imposé aucune 
condition à l’ensemble F, nous allons définir une propriété que l’on pourrait qualifier de 
minimale pour un estimateur, c’est-à-dire de prendre ses valeurs dans le même ensemble 
que le paramètre. On dira qu’un estimateur est strict si T,,(E") C @. 


Exemple 7.1 


Si X suit une loi de Bernoulli (1,0), T, sera un estimateur strict si 
O0 <T,(x;,,...,x,) < 1 pour tout échantillon observé (x,,...,x,). 


Nous allons maintenant définir les propriétés essentielles que doit vérifier un 
estimateur. 
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(à) Propriétés d'un estimateur 


Ayant fait choix d’un estimateur, on se pose la question de savoir s’il s’agit d’un « bon » 
estimateur. Il va donc falloir se donner des critères de qualité. Par ailleurs, il se peut que 
pour certains problèmes on ait le choix entre plusieurs estimateurs et il va donc falloir 
aussi définir un critère de comparaison pour déterminer quel est le meilleur. Enfin, on 
peut se poser la question de savoir s’il n’existerait pas un estimateur qui, pour un pro- 
blème donné, ne serait pas meilleur que tous les autres : c’est le problème de l’optimalité. 
Toutes ces questions vont trouver des réponses dans l’étude des propriétés ci-après où 
nous supposerons pour simplifier que @ est un paramètre réel, c’est-à-dire que @ C R. 
Ces propriétés peuvent bien sûr s’étendre au cas d’un paramètre multidimensionnel. 


2.1 Biais d'un estimateur 


Bien entendu, pour pouvoir considérer T,, (x,,...,x,) comme une valeur approchée de 
0, il faut que les valeurs prises par la v.a. T, ne s’écartent pas trop de la valeur, fixe, de 
0. Comme T,, est une v.a., on ne peut imposer une condition qu’à sa valeur moyenne, ce 
qui nous amène à définir le biais d’un estimateur comme l’écart entre sa moyenne et la 
vraie valeur du paramètre : 


b,(0) = ES(T,) — 0 


D'où une propriété relative au biais d’un estimateur. 


DÉFINITION 
Un estimateur T, de 8 est dit sans biais si pour tout 8 de ® et tout entier positif n: 
E,(T,) = 0 
Exemple 7.2 


Si le paramètre à estimer est la moyenne théorique de la loi, i.e. 0 = E(X), l’esti- 
mateur naturel est la moyenne empirique T,, = Fe Nous avons vu dans le chapitre 
5 que E, (£,) = E(X) = #, donc nous en déduisons le résultat très général que la 
moyenne empirique est toujours un estimateur sans biais de la moyenne théorique 
(espérance mathématique), quelle que soit la loi de probabilité de la variable X. 


Cependant, cette propriété peut ne pas être strictement vérifiée, le biais diminuant 
seulement quand la taille d’échantillon augmente. Ceci correspond à la définition 
suivante. 


DÉFINITION 


Un estimateur T, de 8 est dit asymptotiquement sans biais si pour tout 9 de O : 


En(T,) — 0 quand n 


© Dunod — Toute reproduction non autorisée est un délit. 


Estimation 


Exemple 7.3 

Si le paramètre à estimer est la variance théorique de la loi, 1.e. 0 = V(X), 
2 

n ; ; sr _ FIRE 1 n ps 

l'estimateur naturel est la variance empirique T, = S'° = - 2. (x i— ZX :) et 

nous avons vu dans le chapitre 5 que E, (T,) = 6. Donc S'? est un estimateur 

asymptotiquement sans biais de 8. Nous avons vu aussi que E, ( S2) = V(X) = 8,où 


_ \2 

S2= 1%" (x .— X ) est la variance empirique modifiée qui est donc toujours 
n n-1 i=1 i n 

un estimateur sans biais de la variance théorique, quelle que soit la loi de probabilité 


de la variable X. 


2.2 Convergence d'un estimateur 


Intuitivement, on est amené à penser que si la taille de l’échantillon augmente, l’in- 
formation sur le paramètre 0 va augmenter et donc l’estimateur devrait d’une certaine 
manière se « rapprocher » de la valeur de 8. Cet estimateur étant une v.a., la formulation 
mathématique de cette notion intuitive va faire appel à la convergence en probabilité 
d’une suite de v.a. : T,, prendra des valeurs proches de 0 avec une probabilité d’autant 
plus proche de un que la taille d’échantillon n sera grande. Ceci conduit à la définition 
suivante. 


DÉFINITION 


Un estimateur T, est convergent si la suite de v.a. (T,) converge en probabilité vers 
la valeur du paramètre, c'est-à-dire pour tout 9 de @ : 


T,— 0e P(IT,-0|<e) 1, Ve>0,n— 00 
p 


& P(IT,-6|>e) — 0 


Il existe un moyen en général simple de vérifier cette propriété de convergence, 
à partir de conditions suffisantes faisant intervenir les deux premiers moments de 
l’estimateur, et que nous énonçons dans le théorème ci-après. 


Théorème 7.1 ÉRRRRREEEErcEEErEer Eeeerren eee eeee eee eee ee ES . 


? Tout estimateur sans biais dont la variance tend vers zéro est convergent : 
E,(T,) = 0 


LECEPTELELEC ECC ELEC EE ELELELEELECEL EEE EEE ETELECECEEC EC EEE EEE EECECECCECECEPEECECENCEEECEEEEC EEE ET ENEECEEC EEE EEPEEETEL) 


Ce résultat se déduit directement de l’inégalité de Bienaymé-Tchebychev : 


_ V() 


P,(IT,-6|>e) = 0, Ve > 0, n — 0 
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En fait, sous les hypothèses du théorème, on obtient une convergence plus forte qui 
est la convergence en moyenne quadratique puisqu’ici 


VAT.) = EXT, — 8) — 0 quand n —+ oo. 


Exemple 7.4 

Si 0 = E(X), ce paramètre est estimé sans biais par T, = X,, et on sait de plus 
que V,(T,) = V(X)/n donc V,(T,) — 0 quand n — œ et T,, est convergent (ré- 
sultat que l’on aurait pu déduire directement de la loi des grands nombres). Ainsi, 
la moyenne empirique est un estimateur sans biais et convergent de la moyenne 
théorique E(X), quelle que soit la loi de X. 


Le résultat précédent peut être obtenu sous des conditions un peu plus générales 
énoncées ci-après. 


Théorème 7.2 SERTEEEEEEerEEE seen eee £ 


; Tout estimateur asymptotiquement sans biais dont la variance tend vers zéro est 


? convergent : 


CPP EE TETE EL TELE LEE TEL ELEL EE LE TEL ELITE LE LEE TELE LEL ES EE CE LEE TEL ELEC ELEC ELEC EE EE CET EL EEE TELLE E ELEC EEE EE CET EL EST EL ELE TELE TELE LS 


Là encore, ces conditions suffisantes de convergence en probabilité de T;, établissent 
en fait que cette suite converge en moyenne quadratique. 


2.3 Estimateur optimal 


a) Qualité d'un estimateur 


La qualité d’un estimateur va se mesurer à l’aide d’une distance au paramètre qui peut 
être par exemple [T, — 0] ou (T,, — 0). Pour obtenir un indicateur numérique on peut 
alors déterminer la valeur moyenne de cette distance. L’indicateur généralement retenu, 
car il se prête facilement aux calculs, est l’erreur quadratique moyenne définie pour 
tout 0 par : 


EQ(T,)= Ey(T,-0) =V,(T,)+62(6) 


Dans le cas particulier d’un estimateur sans biais, cette erreur quadratique se confond 
avec la variance de l’estimateur. Si dans l’erreur totale d’estimation on privilégie l’er- 
reur structurelle, mesurée par b° (@), on fera choix d’un estimateur sans biais et l’erreur 
d’estimation se réduira à l’erreur statistique mesurée par la variance de l’estimateur. Si 
on se place donc dorénavant dans la classe des estimateurs sans biais, on pourra com- 
parer deux estimateurs T,, et T” de cette classe par leur variance qui mesure alors leur 
dispersion par rapport au paramètre qui est leur espérance commune. Nous dirons que 
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l’estimateur T, est plus efficace que T si pour tout 9 de @ et pour une taille d’échantillon 
n> N: 
Vo (Ts) < Vo (T,) 


La question se pose alors de savoir si on pourrait trouver un troisième estimateur qui 
serait à son tour meilleur que T,. En cas de réponse positive, il faudrait poursuivre la 
recherche, ce qui nous conduirait à essayer d’améliorer indéfiniment un estimateur. Le 
problème n’admettrait une fin que si l’on savait que l’estimateur obtenu est le meilleur. 
Le paragraphe suivant va fournir des éléments de réponse. 


b) Inégalité de Fréchet-Darmois-Cramer-Rao 


Nous allons voir que dans certaines conditions il existe une borne inférieure pour l’en- 
semble des variances des estimateurs sans biais, ce qui va constituer un butoir ne 
permettant pas d’améliorer sans cesse les estimateurs. D’autre part, si cette borne est at- 
teinte par un estimateur, il deviendra le meilleur et sera qualifié d’optimal dans la classe 
des estimateurs sans biais. Pour énoncer ce résultat, nous avons besoin d’introduire la 
définition suivante. 


DÉFINITION 
On appelle vraisemblance (likelihood) de l'échantillon (X1,... , X,) la loi de proba- 
bilité de ce n-uple, notée L(x1, …, x,; 8), et définie par : 


NÉS" X,:0 )= [TP = x;l0) 


si X est une v.a. discrète, et par: 
Lx, ae .X,:0) = [LC 0) 


si X est une v.a. continue de densité f(x; 0). 


Le théorème suivant va préciser la borne inférieure pour la variance des estimateurs 
sans biais, sous certaines hypothèses relatives à la loi de probabilité de X et que nous 
appellerons hypothèses de Cramer-Rao. Nous ne donnerons pas le détail de ces hypo- 
thèses (voir compléments) qui sont essentiellement des conditions techniques portant sur 
l'existence de dérivées de la densité f de X et la possibilité d’intervertir les opérations 
de dérivation et d’intégration. Cependant, nous ferons figurer dans l’énoncé du théorème 
la condition indispensable pour que cette inégalité soit vraie et qui n’est pas satisfaite 
pour certaines lois usuelles, alors que les autres hypothèses sont généralement vérifiées. 
Enfin, cet énoncé fait intervenir la notion de quantité d’information de Fisher qui est 


définie par : 
à In L\? 
1 (@)=E ( ) 
r O) = Bol 
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Théorème 2.3 Eee eee eee eee eee EEE . 


? Sous les hypothèses de Cramer-Rao, en particulier si E = X(Q) est indépendant du } 


: paramètre à estimer ©, pour tout estimateur sans biais T;, de 8 on a: 


La quantité B;(8) est la borne inférieure de Fréchet-Darmois-Cramer-Rao (FDCR 
en abrégé). Notons que dans les conditions d’application de ce théorème, en particu- 
lier si E = X(Q) est indépendant du paramètre à estimer 4, on obtient une expression 
équivalente de la quantité d’information de Fisher qui est généralement plus simple à 


2 
son (280) 


calculer : 


Exemple 7.5 
Soit X une v.a. de loi exponentielle de paramètre 1/6, ou loi y(1, 1/0), avec 8 > 0, 
de densité pour x > 0: 


J (56) = ze"? 


La vraisemblance admet ici pour expression : 


Liihsssx X,: 0 = IL 6 -ger(- x) 


Pour calculer la quantité d’information de Fisher nous écrivons la log- 
vraisemblance : 


NE (Knsofs k:0) = -n DEEE 


Nous dérivons par rapport au paramètre : 


ML n 1+ 
= —— + — 
20 0 p 2* 


Soit en élevant au carré : 


2 
dm? 1; ,#% 1{+ 
ele Hseg(Ss) 


Si on pose S, = }}”_, X;, on obtient : 


I, (0) = Li -25E (S +0 (s?)] 
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Avec E,(S,) =nE,(X) = n0, E, (S?) = V, (S,) + E5 (S,) = nV, (X) + n°0? = 
n(n + 1)? on obtient : 
n 

I, (8) = A 
Comme X(Q) = R, est indépendant de 8, on peut utiliser la seconde expression de 
la quantité d’information de Fisher, calculée à partir de : 

dmL. h _ 2 
00? O2+ GT 

ce qui permet d’obtenir plus facilement : 


In L n n0 _n 
1,@ = E ( 00? 8-2 


Exemple 7.6 
Si nous prenons maintenant l'exemple de la loi exponentielle sur [0,+o [, de 
densité : 
e®—0) six >0 
0 sinon 


(0) = À 


La vraisemblance s'écrit : 


= 


AE 


0) = exp ge (x, — 8) 


si tous les x; sont plus grands que 0, c’est-à-dire si min {x;/1 <i< n} > 0. 


On a alors : 
InL (x, .x,:0) = - Ÿ x, +n0 
i=1 
d’où ME=net 
din L \? 
L (@)=E ( ) = 
»@ = El % 
d1nL _dhL 


On peut remarquer ici que 
P q que y 06? 


pas avec la valeur de la quantité d’information de Fisher, ce qui s’explique par le fait 
qu'ici X(Q) = [8, +oo[ dépend du paramètre à estimer 0. 


= 0 et par conséquent E, ( ) = 0 ne coïncide 


Estimateur efficace 


Le théorème précédent fournit une borne inférieure pour la variance des estimateurs 
sans biais, qui peut ou non être atteinte. Si cette borne est effectivement atteinte par un 
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estimateur, il sera donc le meilleur, selon ce critère, dans la classe des estimateurs sans 
biais. Cette optimalité se traduit par la définition suivante. 


DÉFINITION 


Un estimateur sans biais T, est dit efficace si sa variance est égale à la borne 
inférieure de FDCR : 


Exemple 7.7 


Si nous reprenons l’exemple de la loi exponentielle de paramètre 1/0, comme 
E,(X) = 6, on sait que T,, = X, est un estimateur sans biais et convergent. De plus : 


Ten: V6) 6... 1 
() =) nn I,() 


donc cet estimateur est aussi efficace. 


REMARQUE Un estimateur efficace est bien sûr optimal, mais dans la classe des esti- 
mateurs sans biais. Si on utilise comme critère l’erreur quadratique, qui est une mesure 
de l’erreur totale où les erreurs structurelle et statistique jouent le même rôle, on peut 


trouver un estimateur qui soit meilleur qu’un estimateur efficace. Par exemple, dans le 


cas d’un échantillon d’une loi N(0,6), on sait que 6? = Yi) X = est un estimateur 
3 Zi= 


264 € . | s 
efficace de o?, avec EQ (0?) =V (ee) = =. Mais, si on retient l’estimateur avec biais 
n 


1 : | : sd 
1,=— ZX, X?, on obtient un estimateur meilleur, c’est-à-dire d’erreur totale plus 
. = 


faible puisque EQ (T,) = 2. < EQ (0°). 


Méthodes de construction d'un estimateur 


Dans les situations où il n’y a pas d’estimateur évident, on est amené à recourir à une 
méthode de construction d’un estimateur, les deux méthodes que nous présenterons ici 
étant celles du maximum de vraisemblance et des moments. 


3.1 Méthode du maximum de vraisemblance 


La vraisemblance L(x,,...,x,;0) représente la probabilité d’observer le n-uple 
(X,,...,x,) pour une valeur fixée de 8. Dans la situation inverse ici où on a observé 
(X1,...,X,) Sans connaître la valeur de 8, on va attribuer à @ la valeur qui paraît la plus 
vraisemblable, compte tenu de l’observation dont on dispose, c’est-à-dire celle qui va 
lui attribuer la plus forte probabilité. On se fixe donc la règle suivante : à (x;,,...,x,) 
fixé, on considère la vraisemblance L comme une fonction de 8 et on attribue à 6 la 
valeur qui maximise cette fonction. D’où la définition suivante. 
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DÉFINITION 


On appelle estimateur du maximum de vraisemblance (emv) toute fonction Ô, de 
Cu... , x) qui vérifie : 


Cette définition ne renseigne en aucune façon, ni sur l’existence, ni sur l’unicité, d’un 
tel estimateur. La recherche de l’emv peut se faire directement par recherche du maxi- 
mum de L, ou dans le cas particulier où la fonction L est deux fois dérivable par rapport 
à 0, comme solution de l’équation = = 0 qui vérifie aussi __ < 0. Cependant, la vrai- 
semblance se calculant à partir d’un produit, on préfère remplacer ce dernier problème 
par le problème équivalent pour la log-vraisemblance, puisque la fonction In est stric- 
PRE 06 qui aura une expression généralement 


è din L 
tement croissante, en = 0 avec 


simplifiée. Remarquons enfin que si ô. est un emv du paramètre 6, alors g (6,) est un 
emv du paramètre g(0) pour toute fonction g. Si par exemple la variance empirique mo- 
difiée s qui est un estimateur sans biais de 0 = V,(X), est un emv pour un modèle 
statistique donné, alors S, est un emv du paramètre g (0) = 6, (X) = V2 _ V0. 
Notons cependant que S, ne peut pas être aussi un estimateur sans biais car on aurait 
alors V, (S,) = Ey (5?) - E5 (S,) = 0 -0 = 0. 


Exemple 7.8 


Cherchons l’emv pour la famille de lois exponentielles de paramètre 1/0. La log- 
vraisemblance est indéfiniment dérivable pour 4 > 0 et nous avions obtenu dans 
l'exemple 7.5 : 


mL. n 1 


0. 6 A 


"x, = %x,, avec: 


à - Li 
qui s’annule en changeant de signe pour 0 = : D à 


PnL _n 2% n . 
en m2" go) 


soit pour 0 = X, : 


donc l’emv est ô. SX 
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Exemple 7.9 
Dans le cas de la loi exponentielle sur [4, +oof, la vraisemblance avait pour expres- 
Sion : 

ete" Q<min{x;/1<i<n} 
L dress ; 0 — = ! Ë 7 = 
(x n ) { 0 min{x;,/1<i<n}<0 


Pour 0 < min {x; /1<i< n} la vraisemblance est une fonction croissante de 0 et 
ensuite elle s’annule ; l’allure générale du graphe de L (cf. figure 7.1) montre bien 
que L est maximum pour 0 = min {x;/1 <i< ris ce qui correspond à l’emv : 


= min {X;/1<i<n} 


L À 
a 
0 min X; 0 
Figure 7.1 


REMARQUE Dans l’exemple 7.9, nous avons In L = n0 — nx, et CE =nne s annule 
pas ; la recherche du maximum de L (ou de InL) s’est effectuée directement, sans avoir 
recours aux dérivées. Rappelons à ce propos que dans la recherche des extremums d’une 
fonction réelle g, la condition g'(x,) = 0 n’est ni nécessaire, ni suffisante, pour qu’il 
existe un extremum en x,,. Cette recherche d’extremum doit se faire directement, à partir 
de la condition qui le définit, c’est-à-dire g(x)—g(x,) a un signe constant au voisinage de 
xo. Ce n’est que dans le cas d’une fonction deux fois dérivable sur un intervalle ouvert, 
que le maximum est obtenu à partir des conditions g/ (xo) = 0 et g” (xp) < 0. 


3.2 Méthode des moments 


Dans le cas où le paramètre à estimer est 0 = E,(X), moyenne théorique de la loi, nous 

avons vu que l’estimateur naturel était la moyenne empirique, ou moyenne de l’échan- 

tillon, X,. De même, pour estimer le paramètre 0 = V,(X), variance de la loi, nous 
n Q 

retenons logiquement comme estimateur la variance empirique S” . . Plus généralement, 


si l’un des moments d’ordre k € N°, non centré m, = E, (X#) = m,(0), ou cen- 


; k : 

tré u4 = Ey (X —m;) = yu,(8), dépend de 8, nous allons chercher un estimateur par 
résolution de l’équation en 8 obtenue en égalant moment théorique et moment empirique 
correspondant, soit : 
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Estimation 


ee Une AE 
Mn = à 2x = me (8) où Hy == > (x -X,) = y, (6) 
La solution de l’équation, si elle existe et est unique, sera appelée estimateur obtenu 
par la méthode des moments. Dans les exemples introductifs où 0 = E,(X) et 0 = 


V,(X), les équations à résoudre s’écrivaient sous forme résolue 9 = X,, et 0 = S"?. 


Exemple 7.10 

Si X suit une loi exponentielle de paramètre 0, on sait que E,(X) = 1/8 etl’équation 
à résoudre s’écrit X, = 1/6, de solution immédiate 0 = Lx. qui correspond à 
l’estimateur obtenu par la méthode des moments : 


6,=1/X, 


Bien entendu, on pourrait utiliser cette méthode avec des moments d’ordres plus 
élevés et obtenir ainsi d’autres estimateurs. En utilisant par exemple la variance 
Vs(X) = 1/67 on obtient le nouvel estimateur 4, = 1/,". 


Cette méthode intuitive se justifie par les propriétés de convergence des moments 
empiriques vers les moments théoriques correspondants (cf. chap. 6, 2.8). 


@ Estimation par intervalle de confiance 


4.1 Exemple introductif 


Un industriel commande un lot de tiges métalliques qu’il ne peut utiliser que si leur 
longueur est comprise entre 23,60 mm et 23,70 mm. Ces tiges ont été fabriquées par 
une machine qui, lorsqu'elle est réglée à la valeur m, produit des tiges dont la longueur 
peut être considérée comme une v.a. X de loi normale N(m, 6), où l’écart type © est 
une caractéristique de la machine, de valeur connue, ici 6 = 0,02 mm. Compte tenu de 
la symétrie de la distribution normale, la proportion de tiges utilisables par l'industriel 
sera maximale si le réglage a été effectué à m, = 23,65 mm. Ne connaissant pas cette 
valeur, à la réception d’un lot de tiges l’industriel prélève au hasard n tiges dont il mesure 
les longueurs X°,,..., X, pour se faire une idée de la valeur du paramètre de réglage m. 
Il calcule la moyenne des longueurs observées et, ayant obtenu la valeur x, = 23, 63, il 
en conclut que, s’il est peu réaliste de croire que la valeur de m est exactement 23,63 mm, 
elle doit malgré tout être très proche de cette valeur moyenne observée sur l’échantillon. 
Il lui paraît raisonnable d’aboutir à une conclusion de la forme « il y a 95 chances sur 
100 que la valeur de m soit comprise entre 23,63 — a et 23,63 + b ». Le problème 
consiste alors à fixer des valeurs précises pour a et b et on conçoit bien qu’elles doivent 
dépendre des « chances » que l’on a attribué à cet intervalle de contenir effectivement 
la vraie valeur de m. L’intervalle ainsi obtenu s’appellera intervalle de confiance et 
sa probabilité qui a permis de le déterminer, niveau de confiance. La longueur de cet 
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intervalle sera bien sûr proportionnelle à ce niveau de confiance. On peut par exemple 
toujours fournir un intervalle qui contient avec certitude le paramètre en le choisissant 
suffisamment large ; mais dans ce cas, cet intervalle ne nous renseigne en aucune façon 
sur la vraie valeur du paramètre. Il faut donc arriver à un compromis entre un intervalle 
pas trop grand et une probabilité assez élevée de contenir le paramètre. 

Pour une famille quelconque de lois de probabilité (P,;,0 € @) on peut donner la 
définition suivante. 


DÉFINITION 


Un intervalle de confiance pour le paramètre 9, de niveau de confiance 1 -a € 
10, 1[, est un intervalle qui a la probabilité 1 — « de contenir la vraie valeur du 
paramètre 6. 


4.2 Principe de construction 


Dans l’exemple précédent, nous avions abouti à un intervalle de la forme x, — a < 
m < X, + b qui correspond à la réalisation d’un événement devant se produire avec une 
probabilité fixée 1 — a. La détermination des valeurs de a et b va donc se faire à partir 
de la valeur 1 — « de la probabilité, fixée par le statisticien, à partir de la condition qui 
s'écrit ici : 

1-a=PÎX,-a<m<X,+b} 
qui est équivalente à : 


I-a=P{-b<X,-m<a}. 


Il n’y a donc qu’une seule condition pour déterminer ces deux valeurs ; cependant, la 
loi de la v.a. x. — m qui sert à construire cet intervalle étant symétrique, on choisit b = a 
et on utilise la variable centrée et réduite pour déterminer la valeur de a qui vérifie la 
condition : 


a X,—-m a 
<< — < 


c/yn c/Vn c/yn 


Si est la f:r. de la loi N(0, 1), alors a est solution de : 
1-a=® (avn/o) — ® (-ava/o) = 2® (avn/o) — 1 


ou 1—-a/2=®% (avn/o), soit ay/n/o = D! (1 — «/2). Pour un niveau de confiance 
de 0,95, soit « = 0, 05, et pour une taille d’échantillon ñ = 100, le fractile d’ordre 0,975 
de la loi N(0, 1) a pour valeur 1,96 et on en déduit a = 0,004, d’où l’intervalle : 


l—-a—=P4«4 - 


23,626 < m < 23,634 


obtenu pour cet échantillon particulier. 
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À partir d’un intervalle que l’on souhaitait obtenir pour le paramètre et dont les bornes 
s’exprimaient en fonction d’un estimateur de ce paramètre, on est arrivé à un intervalle 
pour l’estimateur, qui pouvait être déterminé avec précision puisqu'on connaissait sa 
loi. Ceci va nous fournir le principe de construction d’un intervalle de confiance en 
effectuant la démarche en sens contraire. 


Le point de départ est fourni par un estimateur T, du paramètre @, construit à par- 
tir d’un échantillon (X,,..., X,) et dont on connaft la loi en fonction de 6, ce qui va 
permettre de déterminer les valeurs #, = f, (8) et f, = t,(0) telles que : 


P,{t,(0) <T, <t,(8)} =1-a« 


Il faut ensuite inverser cet intervalle pour T,,, dont les bornes dépendent du paramètre 
6, pour obtenir un intervalle pour 8, dont les bornes vont dépendre de l’estimateur 7, 
c’est-à-dire déterminer les valeurs a = a(T,,) et b = b(T,,) telles que : 


P{a(T,) <6<b(T,)}=1-a 
On peut écrire également P,{0 € [a (T,) ,D (T,)] } = 1 — « et on voit ainsi que 
[a(T,,),b(T,,)] est un intervalle de confiance de niveau 1 — a pour le paramètre 6. Il s’agit 
d’un intervalle aléatoire, au sens où ses bornes sont des v.a., dont chaque échantillon 


fournira une réalisation. Pour obtenir cet intervalle, il faut donc trouver l’ensemble des 
valeurs de 4 pour lesquelles on a simultanément, pour T,, fixé : 


1,(0) <T, et T,, < t,(0) 


Cet ensemble sera plus ou moins facile à obtenir selon le comportement des fonctions 
t, et f,. Si par exemple ces deux fonctions sont croissantes, on voit sur la figure 7.2 que : 


H(O)<T,S0<H (T,) et T,<(@)e0>C (I) 


1 


n 


t(8) 


aT)=65(T)  bl)=t41(T) Ô 


Figure 7.2 
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L’intervalle est facile à obtenir ici car les fonctions f, et f, sont inversibles, et on 
obtient alors : 


1 (@O)<T,<bO6)ea(T,)=6"(T) <0<F'(T,)=b(T,) 


Il existe cependant une part d’arbitraire dans le choix simultané de f, et f, puisqu'il 
n’y a qu’une seule condition pour déterminer ces deux valeurs, qui peut d’ailleurs aussi 
s'écrire P,(T, <t,)+ PT, > t,) = à, le risque total « pouvant être a priori réparti de 
multiples façons. Posons &, = P,{0 > b (T,)} et &) = P,{(0 <a (T,)} ; les différents 
choix possibles sont les suivants. 

a) Intervalle bilatéral («,a, > 0) 

+ Symétrique : &, = &; = a/2 

C’est le choix que lon fait si la loi de T,, est symétrique, ou si on n’a aucune information 
particulière, ce choix étant le moins arbitraire. 

. Dissymétrique : «, £ « 

Seules des raisons très particulières peuvent permettre de fixer les valeurs de «, et @;, 
telles que à, +a, = a. 

b) Intervalle unilatéral (œ,«; = 0) 

+ À droite : a, =0,a = a 

C’est l’interprétation donnée au paramètre 0, comme par exemple la résistance d’un 
matériau qui doit être supérieure à un seuil minimum, qui conduit à un intervalle de la 
forme 8 > a(T,). 

+ À gauche : % =a, a =0 

Si par exemple le paramètre est une proportion de défectueux dans un lot, ou un taux 


d’impuretés, on souhaite qu’il soit inférieur à un seuil maximum, d’où un intervalle de 
la forme 0 < b(T,). 


4.3 Intervalle pour une proportion 


Nous allons voir sur cet exemple que l’inversion de l’intervalle pour la statistique n’est 
pas toujours aisée, surtout lorsque sa loi est discrète. Supposons que lon ait effectué un 
sondage pour déterminer les intentions de vote pour un certain candidat à une élection 
présidentielle. À chaque individu interrogé, on associe une variable de Bernoulli qui 
prend la valeur 1 si cet individu i déclare vouloir voter en faveur de ce candidat : 


1 p 
D 1<i< 
i e Hey <i<n 


Le paramètre p de cette loi de Bernoulli représente la proportion, dans la popula- 
tion, d’électeurs favorables à ce candidat et est estimé par la proportion observée dans 
l'échantillon : 


1% 
na 
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Nous savons que, en tant que moyenne empirique estimant une moyenne théorique, 
cet estimateur naturel de p est sans biais et convergent. Nous allons établir maintenant 
que c’est aussi l’estimateur du maximum de vraisemblance et qu’il est efficace. Pour 
cela, on suppose que la taille de la population est suffisamment grande pour que les 
variables X, puissent être considérées comme indépendantes, c’est-à-dire que l’on se 
place dans le cadre d’un schéma binomial avec remise. La vraisemblance s'écrit alors : 


Lexsp) = [rt Q nt 2 plais (= pr Ex 
i=1 


avec x, € A . Un O ien onc comme ex ression € 1a 10 -vraisem ance : 
; € {0,1}. On obtient d p de la log bl 


n n 


NE snhe D x In p + n—Yx; In(1 — p) 


i=1 i=1 
d’où en dérivant : 


DE da sd AUD (es) 


op p l—p p(A—p) 
en ayant posé s, = }_, x; ; cette dérivée s’annule pour s, — np = 0, soit p = s,/n, avec 


comme dérivée seconde : 


carO0 <s, <n; p, = s,/n est donc l’emv de p. La variable S, suit une loi B(n, p) 
et comme nous sommes dans les conditions d’application de l’inégalité FDCR, nous 
pouvons calculer la quantité d’information de Fisher par : 


ÊnL) 20), EG) n 
0p? p? (L=p} . (=?) 


nO=E 


Comme E (6,) = pet (6,) = p(l—p)/n = 1/1, (p), on en conclut que p, est 
efficace. 

Pour construire un intervalle de confiance pour p de niveau 0,95 il faut déterminer les 
valeurs def, =t,(phetf,= ft, (p)telles queP (r £DiS t) = 0,95. Nous pouvons pour 
cela utiliser la loi exacte de np, = S,, et retenir un intervalle à risques symétriques, c’est- 
à-dire retenir les conditions P (nf, < nt,) = P (nf, > nt,) = 0,025. Cependant, une 
première difficulté se présente puisque la loi est discrète et que ces égalités n’admettent 
pas forcément de solution, au sens où il n’y a pas de fractiles d’ordre 0,025 ou 0,975. 
Nous allons donc construire un intervalle qui sera de niveau au moins égal à 0,95 en 
retenant plutôt les inégalités P (nf, < nt) < 0,025 et P (n, > nt) < 0,025. On 
doit donc déterminer le plus grand entier n, tel que : 


> ( : }#a — p}""* < 0,025 


k=0 
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et le plus petit entier n, tel que : 


> : }ra <p} 2097 


k=0 


Pour tout entier fixé n, et pour chaque valeur de p, on peut déterminer les solutions 
t, =n/nett, = n,/nde ces inéquations et tracer ainsi point par point le graphe de ces 
deux fonctions de p. Pour chaque verticale, c’est-à-dire pour p fixé, ces deux courbes 
déterminent un intervalle [f,(p), t,(p)] tel queP (r PS )) > 0,95. Pour une va- 
leur observée p, l'intersection de l’horizontale correspondante avec ces deux courbes 
permet de lire sur l’axe des abscisses l’intervalle des valeurs de p pour lesquelles on a si- 
multanément f, (p) < P, et f(p) > p, (cf. figure 7.3). Ainsi, l'intervalle de confiance 
s'obtient par simple lecture de l’abaque correspondant à un niveau de confiance donné. 
On a un couple de courbes associées à chaque valeur de n. 


; À 
Pa 
il L 
t{P) 
t\(p) 
Pn 
0 intervalle pour p il P 
Figure 7.3 


Dans l’exemple proposé, si pour n = 100 on a observé l’estimation P,99 = 0,44 la 
lecture de l’abaque 2 (où p, = x, est en abscisse et p en ordonnée) conduit à l’intervalle 
de confiance bilatéral : 


0,341 < p < 0,538 


Si on ne dispose pas d’abaque permettant d’obtenir sans calculs l’intervalle exact, et 
si la valeur de n est suffisamment grande, on obtiendra un intervalle approché (1.e. de 
niveau voisin de 0,95) en utilisant la loi asymptotique de p, déduite du théorème central 
limite : 


a = P 
era N (0, 1) 


© Dunod — Toute reproduction non autorisée est un délit. 


Estimation 


On retient alors un intervalle symétrique, à partir de la valeur de a lue dans la table 2 
de la loi normale, telle que : 


p(-u<viÊ Er ce =1l-a 
=) 


pq 


Soit pour «a = 0,05 : a = 1 (0,975) = 1,96 d’où : 


ACTE cree) = 0,95 
n n 


Pour en déduire un intervalle pour p, il faudrait résoudre ces deux inéquations du 
second degré en p. Il est plus simple de faire une seconde approximation en remplaçant 
p par p, dans les bornes de l’intervalle, ce qui conduit à l'intervalle de confiance pour p : 


ee 16, ( hs rs, 16, (1-6) 
n n 


où a = ®!(1 — a/2). On considère que cette approximation est acceptable pour 
np(1 — p) > 3. Avec les données de l’exemple on obtient l’intervalle : 


0,343 < p < 0,537 


On aurait pu également remplacer p (1 — p) par sa borne supérieure, qui vaut 1/4, et 
obtenir ainsi l’intervalle approché le plus grand : 


= a 
Ph — 


<p<p,+ 


24/n 7e 


Dans cet exemple on obtient : 
0,342 < p < 0,538 


intervalle qui est donc bien un peu plus grand que le précédent ; seul le premier intervalle 
est exact, mais les approximations utilisées ici avec n = 100 donnent des résultats très 
voisins. 


4.4 Intervalles associés aux paramètres de la loi normale 


On dispose d’un échantillon (X,,...,X,) d’une va. X qui suit une loi N(m, o) pour 
construire un intervalle de confiance relatif à l’un des deux paramètres de cette loi, 
l’autre paramètre étant connu ou inconnu. Ceci correspond aux différentes situations 
que nous allons étudier maintenant. 
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Intervalle pour la moyenne d'une loi normale d'écart type connu 


L'exemple introductif se situait dans ce cadre-là et nous avons obtenu un intervalle de 
confiance, de niveau 1 — à, pour le paramètre m, centré sur l’estimateur X, 

cu o a o 

X,-u— <m<X,+u— 

n n 

où u est le fractile d’ordre 1 — «/2 de la loi normale standard, soit u = "1 (1 — «/2). 
Cet intervalle est de longueur non aléatoire ! = 2uo/ V7, proportionnelle au niveau de 
confiance par l'intermédiaire de u et inversement proportionnelle à la taille de l’échan- 


tillon par le terme 1/ Vn. Pour un niveau de confiance fixé, c’est l’intervalle symétrique 
de longueur minimale puisque la loi de l’estimateur utilisé est symétrique. 


Intervalle pour la moyenne d'une loi normale d'écart type inconnu 


La statistique utilisée dans la situation précédente, et dont la loi était connue, était la 
variable normale centrée-réduite : 


X,-m X,-m 
RER V/n Rare 
c/ V/n ç 
Elle ne peut plus convenir ici puisque le paramètre © est inconnu et va donc devoir 
être remplacé par un estimateur, basé sur la variance empirique modifiée qui est un 


estimateur sans biais de la variance théorique o? : 


s=LX(x-x) 


i=1 


On utilise donc comme nouvelle statistique : 


Va m 


n 


dont la loi est connue ; en effet, si nous divisons numérateur et dénominateur par o, elle 
peut aussi s’écrire : 


(En) (env) 
Va@-D#/G@-0 


où on voit que le numérateur suit une loi normale centrée-réduite et que le dénominateur 
est la racine carrée d’une v.a. de loi du khi-deux réduite (divisée) par son nombre de 
5 : | s? : 
degrés de liberté, car nous avons vu au chapitre 5 que (n — 1) 7? .. Comme d’après 
©! n-1 
le théorème de Fisher numérateur et dénominateur sont indépendants, on en conclut que 


la statistique 4/7 _ 


, utilisée ici, suit une loi de Student à n — 1 degrés de liberté. Par 
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lecture de la table 6, on peut donc déterminer la valeur de f telle que : 
X_— 
P te Ve «1 =1-a 


La valeur de f est donc le fractile d’ordre 1 — «/2 de la loi de Student T,,_.. L’intervalle 
a bien sûr été choisi symétrique puisque la loi utilisée est symétrique. Par inversion de 
cet intervalle, on obtient : 


n 


ER: = 
PI X,-1—<m<X,+t =l-a 


n n 


ce qui fournit l'intervalle de confiance pour m de niveau 1 — a, centré sur X:, mais ici 
de longueur aléatoire L, = 218$, / V/n. 


Exemple 7.11 


Sur un échantillon de n = 30 durées de vie d’un certain modèle de lampe on a obtenu 
comme moments empiriques x39 = 2000h et 539 = 300h. L’intervalle de confiance 
de niveau 0,95 pour la durée de vie moyenne m est donc : 


530 
4/30 


où f est défini par P(-t < T5 < t) = 0,95 ou PT, < t) = 0,975 soit ft = 2,045 
d’où l’intervalle : 


_ ’ 530 
X30 — 


<m<X3+t 


1888 < m < 2112 


de longueur / = 224 h observée sur cet échantillon. Si o avait été connu, de même 
valeur que celle observée sur l’échantillon, soit o = 300, l'intervalle correspondant 
aurait été : 
s _ s 

se <m< X30 +u en 
V30 V30 
avec u = ®7!(0,975) = 1,96 soit l'intervalle 1893 < m < 2107, de longueur 
[ = 214h, inférieure à la précédente. Ainsi, même en cas d’estimation parfaite, 


c’est-à-dire telle que s, = © , l'intervalle obtenu est plus grand ; la connaissance 
du paramètre © conduit logiquement à un intervalle plus précis. 


X30 — U 


Intervalle pour la variance d'une loi normale d'espérance connue 


Pour estimer la précision d’un thermomètre, on réalise n mesures indépendantes de la 
température d’un liquide qui est maintenu à température constante, égale à 20 degrés 
Celsius. Compte tenu des erreurs de mesure, la valeur indiquée par le thermomètre peut 
être considérée comme une v.a. normale dont la moyenne m est la valeur exacte de la 
température, soit icim = 20, et dont l’écart type o est inconnu et caractérise la précision 
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du thermomètre. L’estimateur, basé sur l’échantillon (X,,... , X,) de cette loi N(m, 0), 
est ici : 


2 
estimateur sans biais, convergent et efficace, de loi connue : n 6, / o? » x? . On peut 
donc déterminer les valeurs de a et b telles que : 

2 

2 

Pla<n— <b|=1-a 

0? 

ce qui conduit à l’intervalle de confiance défini par : 
io 2 


c, : OC, 
P\n— <o<n—|-1-a 
b a 


Cependant, il n’y a qu’une seule condition pour déterminer les deux valeurs a et b 
et il reste un degré d’incertitude puisque la loi utilisée n’est pas symétrique. Si on pose 
a = P(y?<a)et a, = P (7? > b), la seule contrainte dans le choix de a, et æ, est 
œ, + a = à. Dans l’exemple retenu, si on a observé sur un échantillon de taille 15 


la valeur 6 = 18 et qu’on retient un intervalle à erreurs symétriques (choix le moins 
arbitraire), pour un niveau de confiance 1 — & = 0,99 on lit dans la table 5 les valeurs 
a = 4,60 et b = 32, 8 d’où l'intervalle : 


8,23 < o° < 58,70 


Mais, compte tenu de l’interprétation du paramètre qui mesure ici un degré d’impré- 
cision, on souhaite qu'il soit le plus faible possible et on retient plus logiquement un 
intervalle unilatéral à gauche, de la forme 06? < constante, ce qui correspond au choix 
&, =a=0,0leta, = 0, soit a = 5,23 et l'intervalle : 


o? < 51,63 


Intervalle pour la variance d'une loi normale d'espérance inconnue 


Quand le second paramètre m de la loi normale est inconnu, l’estimateur sans biais et 
convergent de o? qu’il faut retenir est : 


s-Ly(x-x) 


i=1 


Sa loi est connue, (n — 1) S? /o? 2e , - et on peut donc déterminer les valeurs de 
a et b telles que : 
S2 
P GREEK D =l-a 
(3 
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Estimation 


ce qui permet d’en déduire l’intervalle de confiance défini par : 
52 S? 
P CS =1-a 
a 


Là encore, il n’y a qu’une seule contrainte pour déterminer les valeurs de a et b; si 
nous posons 4, = P (a < a) et a, = P (y > a) la contrainte est «, + a@, = a. 


Exemple 7.12 


Sur un échantillon de seize chiffres d’affaires de magasins d’une chaîne de grandes 
surfaces on a observé S' = 72, 53. L’intervalle de niveau 0,95 à risques symétriques 
est défini à partir de «, = «, = 0,025 et on lit dans la table 5, a = 6,26 et b = 27,49 
d’où l'intervalle 39,56 < o? < 173, 79. Si on fait le choix d’un intervalle unilatéral à 
gauche, soit «, = « = 0,05 et a, = 0 on obtient a = 7,26 et l'intervalle o? < 149,86 
qui est de longueur plus grande que le précédent. 


Tous les intervalles précédents ont été construits à partir d’une statistique dont la loi 
était indépendante du paramètre 9 à estimer et que lon appelle une fonction pivotale 
pour 8. Cependant, dans certains problèmes on peut seulement trouver une fonction 
quasi pivotale pour 4, c’est-à-dire une statistique dont seule la loi asymptotique est 
indépendante de 6. 


Intervalle pour l'écart type d'une loi normale d'espérance connue 


Supposons pour simplifier que la loi normale soit centrée ; l’estimateur naturel de la va- 
riance 0°, c’est-à-dire l’estimateur de la méthode des moments, sans biais et convergent, 


est : 


1 
= D>X 


i=1 


et sa loi est connue : no? / 6? . . Si on retient o, comme estimateur de o, cet estima- 


teur ne pourra pas être sans biais, car dans ce cas on aurait V (o,) = E (o?) — E? (o,) = 


©? — 6? = 0. On démontre que cet estimateur est asymptotiquement sans biais, avec 
& 1 js 
E(o,) = oa, où a? ru “ avec €, —> 0 quand ñn — . Nous allons écrire la 


n n 
vraisemblance pour établir que o,est l’emv de o : 


1 1 + 
Elo cie — EXP — * 
(V2) 26? D 


et la log-vraisemblance s'écrit : 


nEfs:%0)e -; n2r-nino - = Dee 
FL 
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d’où en dérivant : 


3no? On 


2 = —-+ < 0; cette valeur correspond bien à un 
Lex 


. ; n ce 
a pour valeur en ce point ; a w 


n n n 
maximum. La quantité d’information de Fisher peut se calculer ici par : 


PL) n AR) _2n 


62 o4 62 


Pour obtenir un estimateur qui puisse être efficace, il faut d’abord qu’il soit sans biais 
et c’est le cas ici de l’estimateur 6, = 6,/a,. Sa variance vaut : 


LA (o,) : o?— a6? _ 0? 


V (6,) = un He) 


et donc 6, est asymptotiquement efficace. Bien que la loi exacte de 6;, ne soit pas connue, 
on va pouvoir construire un intervalle de confiance à partir de la fonction pivotale 
no? /o?. On peut en effet déterminer les valeurs de a et b telles que : 
cn 
Pla<n—<b|]=1-a 
02 


et, comme la fonction racine carrée est croissante, on en déduit l’intervalle de confiance 


Por <o <ofr) = 1-0 
b a 
Exemple 7.13 


Sur un échantillon de taille ñn = 100 on veut construire un intervalle de confiance de 
niveau 0,95 pour © à partir de l’observation CAS = 1,945. Si on retient un intervalle 
à risques symétriques, on lit dans la table 5 les fractiles a = 74,22 et b = 129,56 


d’où l'intervalle 1,23 < © < 1,62 de longueur 0,39. 


pour © défini par : 


Nous allons comparer l’estimateur précédent à un estimateur basé sur l’écart absolu 
moyen : 


1 
2.2.2 1% 
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Estimation 


Son espérance est égale à celle de : 


1 1 St 
E(IX|) = J Ixle*/2 ax 
oV2x / -® 


soit, avec le changement de variable x? = 2o?u : 


+oo +oo 
E(IXN = a c'odu= of? | aus o1)2 
1/2x J0 T Jo T 


L’estimateur sans biais que lon retient est donc : 


D’après la loi des grands nombres : 
D,— E(IXT) 
p 


donc T,, est convergent. Sa variance est : 


2 2 
V (T,) = 5V (D,) = 5 VUXD = 5. (e = 2.) — (5 = 1) . 


Si on compare les deux estimateurs sans biais 6,, et T, : 


V(T,) : (x — 2) a? 


n 


ER TR 
V (6) 2n (1-— a) ue L 


donc 6, est préférable à T,, ce qui était prévisible car nous avions vu qu’il était 
asymptotiquement efficace. 


Pour construire un intervalle de confiance, nous allons utiliser la loi asymptotique de 
l’estimateur T\,, déduite du théorème central limite : 


D, -E(IXT) 
gen Op 
d’où : 


T,-0o 
— N (0,1) 


Ve vo 


On peut donc déterminer une valeur approchée de u telle que : 
T,-o 
PA -uU< Yn—— <u;=1-a 
oyzx/2-1 
ce qui conduit à l’intervalle de confiance : 
T T 


1+uyz/2-1/Vn FX 1-uy/z/2-1/Vn 
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Exemple 7.14 


Sur le même échantillon que dans l’exemple 7.13, de taille n = 100, on a observé 
d, = 1,084. L’intervalle de niveau voisin de 0,95 est alors 1,16 < © < 1,56 de 
longueur 0,40. 


© Compléments 


5.1 Inégalité de Fréchet-Darmois-Cramer-Rao 


Nous allons préciser les hypothèses de Cramer-Rao évoquées dans l’énoncé du théorème 
7.3. L'ensemble © est un ouvert sur lequel la densité f(x; 0) ne s’annule en aucun 
point x et est dérivable par rapport à 8. On suppose également que l’on peut intervertir 
dérivation par rapport à 8 et intégration, et que la quantité d’information de Fisher est 
strictement positive. La variance d’un estimateur sans biais est donc minorée par un 
nombre positif, d’autant plus petit que l’information de Fisher est grande. On ajoute 
souvent l’hypothèse que la densité est deux fois dérivable par rapport à @ et que l’on 
peut toujours intervertir dérivation par rapport à 0 et intégration. On obtient alors une 
autre expression de l’information de Fisher, vue au $ 2.3, et généralement plus simple à 
calculer. 

L’inégalité FDCR se généralise au cas où le paramètre à estimer est g(@), g étant une 
fonction réelle. Si T, est un estimateur sans biais de g(8), si on peut encore échanger 
dérivation par rapport à @ et intégration de T\,, alors : 


2 
[g’ (0) 
PT) > ——— 
UE TE 
Si l’estimateur présente un biais b,(8), alors : 


[B! (6) + 8’ (6) 


2 
Vo (T,) > b? (6) + AO 


L’inégalité FDCR se généralise également au cas multidimensionnel, @ étant un 
ouvert de R?, l’information de Fisher devenant la matrice dont l’élément ligne i, 
colonne j 1 <i,j < p,est: 


E on L ” on L 
©\ 6, ” 0, 


ou, dans le cas où on peut dériver deux fois et échanger avec l'intégration : 


2 
E, (- 0“ In L 
00,00; 
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Si T,, est un estimateur sans biais de g(8), g étant une application de R? dans R?, 
alors l’inégalité FDCR se traduit par l’affirmation que la matrice : 


a (#)c'o(4) 


est semi-définie positive, étant la matrice dont l’élément ligne i,1 < i < q,colonne j, 


: 08; == 
1 < j< RS 


5.2 Statistique exhaustive 


Dans l’exercice 3, pour une famille de lois géométriques, on établit que l’information 
apportée par la somme des observations est égale à celle apportée par les données indivi- 
duelles. Ainsi, la connaissance de cette seule statistique n’a pas diminuée l’information 
apportée par toutes les données. Nous allons voir sur un autre exemple comment peut 
se traduire cette propriété intéressante pour une statistique et qui conduira à la notion 
d’exhaustivité. 


Exemple 7.15 


Considérons un contrôle industriel de pièces défectueuses, effectué en tirant avec 
remise n pièces dans un lot, pour connaître la proportion @ de défectueuses. À chaque 
pièce tirée on associe une v.a. de Bernoulli : 


1 0 | 
x= À PT 


Le rang de tirage des pièces défectueuses n’ apporte évidemment aucune information 


IA 
UN 
>= 


sur le paramètre 8 et toute l’information apportée par l’échantillon (X,,...,X,) est 
contenue dans la statistique T' (X:, ee ,X,) = ÿ_, X; qui suit une loi B(n, 6). Pour 
préciser cette évidence, nous allons déterminer la loi d’un échantillon lorsque cette 
statistique a une valeur fixée f, soit : 


PA ER EX, TE) 
PT =?) 
Ona P,(X; = x;) = 0*(1—0)!-% , x, € {0,1} et donc: 


D D 0 7 9 A 


n 


Put = Te Pl rCie DA 


= g! (1 _ 0)! 
Comme : 
P,T=n=(")0" 4-0)" 


on en conclut : 


PCs men lT=4) 
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résultat prévisible en remarquant que (r) représente le nombre de choix des f indices 
i pour lesquels x; = 1. On constate donc que cette probabilité est indépendante du 
paramètre inconnu 6 . 


Cet exemple nous montre que si la loi de l’échantillon, conditionnellement à une 
valeur fixée de la statistique, est indépendante de la loi de X, c’est-à-dire du paramètre 6, 
cela traduit le fait que les valeurs individuelles n’apportent pas plus d’information sur 
8 que la seule valeur de T. Nous dirons qu’une statistique T,, est exhaustive (sufficient) 
si la loi conditionnelle de (X°,,...,X,) pour T = ft fixé est indépendante de 8. Cette 
propriété d’exhaustivité pourra se démontrer facilement à l’aide du résultat suivant. 


Théorème 7.4 - ÉRDAEEEEEEECEEETENTTEEESENEEr er Eee sense ee ses e ee ; 


Théorème de factorisation (Neyman-Fisher) 


? Une statistique T, est exhaustive s’il existe deux applications mesurables positives 
i get h telles que la densité L de l'échantillon puisse se factoriser sous la forme : 


Lu = A0), 


Cette factorisation n’est bien sûr pas unique, mais la quantité À (x Fe ) = 
y (x, ss X St (x a #1) peut représenter la densité de (X,, és X,) IT, = ft et dans 
ce cas g (f; 0) est la densité de T,,. 


Exemple 7.16 
Soit X une v.a. de loi €(1/0) = 7(1, 1/0) et considérons la statistique T, = X"_, X,; 
qui suit la loi y (n, 1/0). La vraisemblance s’écrit : 


1 1 + 
Elératio) Te. (x) me PS 2% 


ssh.) 


en ayant posé g (f; 0) = 1/0"e”t/0 et h (x, ss %) = 1er ER ds +) ce qui montre 
que T,, est exhaustive. Mais on peut également prendre : 


AOC m eee le 0 
qui est la densité de T,,, et dans ce cas : 
'(n) (n— 1)! 
h És et) = 1e ( ol = ue Ne (x, tal 


i=1 


est la densité de l’échantillon conditionnellement à T,, = f. 
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Quand T prend ses valeurs dans l’espace des paramètres ©, on dit que T est un ré- 
sumé exhaustif pour 0. Quand T est à valeurs dans R°, on dit que T est une statistique 
exhaustive d'ordre s. Une statistique exhaustive pour un échantillon est bien entendu 
exhaustive pour toute fonction de cet échantillon. 


Dans l’exemple précédent, nous aurions pu choisir d’autres statistiques exhaus- 
tives comme par exemple (X,+X,,X3,...,X,), (X,+X,+X3,X4,..,X,)… ou 
l'échantillon lui-même (X 1 À), X :) puisque l’application identique est toujours une 
statistique exhaustive. Notons aussi que T, est une fonction de toutes ces statistiques. 
Il est donc souhaitable de réduire au maximum l’espace des observations sans perdre 
d’information sur 8. C’est ce que réalise une statistique exhaustive minimale (minimal 
sufficient, ou necessary and sufficient) S qui est une fonction de toute autre statistique 
exhaustive T. De façon précise, si T est à valeurs dans G et S à valeurs dans F, alors il 
existe une application mesurable g : G — F telle que S = g(T). 


Nous allons introduire une troisième notion et faire le lien entre elles. Une statistique 
T est dite complète (ou totale) si toute v.a. À telle que A(T) est d’intégrale nulle pour P, 
est nulle P, -presque partout. Avec cette nouvelle définition, on peut énoncer le résultat 
suivant. 


Théorème 7.5 REEEEEEENTErEErErerse enr een e eee eee eee EEE . 


i Toute statistique exhaustive et complète est minimale. 


Il faut cependant faire attention : une statistique exhaustive minimale n’est pas for- 
cément complète. 


5.3 Famille exponentielle 


La famille des lois exponentielles joue un rôle très important en statistique car elle pos- 
sède un certain nombre de propriétés intéressantes. Il s’agit des lois dont la densité peut 
s’écrire sous la forme : 


k 


f (:0)= a @)b(Gexp | Ya; (6)T, (x) 


j=1 


Exemple 7.17 


Loi binômiale : 


ET n P 
f Gp) = (A D (Jep(xn?) 
a (p) = In 


D TH=x 
=» 


219 


Statistique et probabilités 


Exemple 7.18 
Loi de Poisson : 
f (x;:0) = + exp (x In 6) 
a(8)=In0 et T(x) = x 


Exemple 7.19 
Famille des lois y (p; 0) : 


f (x; p,0) = on 18, OO exp [0x + (p — 1) Inx] 


a =-0,a, =p-1et Ti(x)=x,T, (x) =Inx 


Le théorème de factorisation permet de conclure que la statistique : 


TX X,)= DE (X;), ou x) 


est exhaustive. En effet, la vraisemblance s’écrit dans ce cas : 


k 
FAR o) = @ (T5 DEP 


j=1 


ayant posé T; = > T,, (x;) . Dans le cas où les fonctions «; sont linéairement indépen- 
dantes, cette statistique est de plus minimale. On fait alors le changement de paramètres 
0; = «a;(0), 1 < j < k, dans la famille exponentielle, ce qui correspond à une nouvelle 
famille P, où 0 = (8,,... ,0,) est appelé paramètre naturel de la famille exponentielle. 
On peut énoncer le résultat suivant. 


Théorème 7.6 - SRDEEEEEEEEENEEEEEEEEEEEEEEEEEETEESEr Eee eceens encens eee . 


Si la densité de la famille exponentielle s’écrit sous la forme : 


f(x:0) = a (6) b(x)exp DU OT, cs) 


j=1 
où 0 = (0,,.. ,0,) appartient à @ qui contient un pavé de RÉ (ou qui est d’intérieur } 


? non vide), alors la statistique T = (T,, .… , T,) estexhaustive, complète et minimale. ? 


LCPPTETEPEP EEE ELEC EC EEE LEE EC EEE ELEC EEE EEE EEE TEE ELEC ECEEC EEE EETEETETECEETECECEC EEE EEE ENEEETEECENECCET EEE EEE ECTS 


220 


© Dunod — Toute reproduction non autorisée est un délit. 


Estimation 


Exemple 7.20 
Loi binômiale : T(x) = x, donc ÿ7_, X;, ou X,, est une statistique exhaustive et 
complète pour le paramètre p. 


Exemple 7.21 


Loi de Poisson : x. est une statistique exhaustive et complète pour le paramètre 6. 


Exemple 7.22 
Famille des lois 7 (p; 0) : la statistique (T, = >", X;,T;, = X”_, In X;) est exhaus- 
tive pour le paramètre (0, p). 


Exemple 7.23 


Loi normale : 


et T = (D: AD x 2 est exhaustive complète pour le paramètre 0 = (m, o?). 


Dans le cas où l’ensemble E = X(Q) des valeurs possibles pour X est indépendant 
du paramètre 0, le théorème de Darmois-Koopman énonce que l’appartenance à la fa- 
mille exponentielle est une condition nécessaire et suffisante d’existence d’un résumé 
exhaustif d'ordre k pour un paramètre vectoriel. 


Exemple 7.24 
Loi de Cauchy : 
fé = 1 1 
T1+(x—0) 
cette densité n’appartient pas à la famille exponentielle, donc il n’existe pas de résumé 
exhaustif pour 6. 


Exemple 7.25 


Loi uniforme sur [0, 4] : 


f (50) = Sion (9 


cette densité n’appartient pas à la famille exponentielle et cependant on peut établir 
grâce au théorème de factorisation que X,,, = max {x pes À +. est une statistique 
exhaustive pour 9. Ceci provient du fait que le théorème de Darmois-Koopman ne 
s'applique pas, l’ensemble E = X(Q) = [0,0] dépendant du paramètre 06. 
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La famille exponentielle permet d’obtenir un estimateur efficace et comme le théo- 
rème suivant le précise, c’est une condition nécessaire. 


Théorème 7.7 REEEEErEEnrEErrseereenreereeers ere eee sers eee eee EEE EEE TES 


Théorème de Koopman 


? Sous les hypothèses de Cramer-Rao, la dérivée de f par rapport à @ étant continueen : 
? 0,siT, est un estimateur sans biais du paramètre réel g(@), alors T,, est un estimateur } 


É efficace si, et seulement si, il existe des fonctions réelles «, B et y telles que : 
In f(x; 0) = B(0) + 7 (x) + a (O)T (x) 


? Lastatistique T, = : en (X ) est exhaustive, complète et minimale et constitue: 
: n i=1 L : 
: un résumé exhaustif d’ordre un; c’est aussi un estimateur efficace du paramètre : 
Î g(0) = —B'(0)/a"(0) qui est le seul paramètre que l’on peut estimer efficacement È 
? (ou une fonction affine de celui-ci) et qui n’est pas forcément le paramètre d’intérêt. } 


Exemple 7.26 


Loi de Poisson : 
In f(x; 0) = —0 — Inx! + xin@ 
B(0) = —6,a(0) = In0,T (x) = x 


L’estimateur T,, = . HAS À (X;) est efficace pour g(0) = 6. 


Exemple 7.27 
Famille de lois y (p) : 
nf (x; p) = —Inl (p) — x + (p — 1) Inx 
BG)=-Ihl(p),a(p}=p-1,T(x) = Inx 


L’estimateur T, = DE In X, est efficace pour g(p) = L’(p}/T(p) qui est un 
paramètre de peu d’intérêt. 
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5.4 Amélioration d'un estimateur 


L'existence d’une statistique exhaustive pour le paramètre permet d'améliorer, en utili- 
sant le critère de la variance, un estimateur sans biais. 


Théorème 7.8 RRREEEEEEETEECEErTEErEETeneeeer ere eens eee ee eee eee eee eee EEE ; 


Théorème de Rao-Blackwell 


Si Test une statistique exhaustive pour la famille P, et S un estimateur sans biais 


: de g (8), l’estimateur E, (SIT) est sans biais et préférable à S. 


L’espérance conditionnelle E, (S|T) permet bien de construire un estimateur, car 
elle est indépendante de 8 en raison de l’exhaustivité de T.. 


Avec le critère de la variance, on peut espérer trouver un estimateur optimal dans 
la classe des estimateurs sans biais de variance finie. Cet estimateur n’est pas néces- 
sairement efficace, mais bien sûr s’il existe un estimateur efficace il est optimal. Dans le 
cas d’une statistique exhaustive complète, l’estimateur amélioré de Rao-Blackwell est 
optimal. 


Théorème 7.9 - SRCEEEEEEETEETENTEEESErerEEeere sers eere cesser EEE EEE ES " 


Théorème de Lehmann-Scheffé 


Si T est une statistique exhaustive complète pour la famille P, et S un estimateur ? 
sans biais de g (8), l’estimateur E, (S[|T") est optimal dans la classe des estimateurs 
? sans biais. 


Exemple 7.28 


Pour la loi uniforme sur [0, 0],,5 = 1%. est un estimateur sans biais de 0. On peut 
établir que X,,, — max {X,,..., X,} est une statistique exhaustive et complète pour 


0. Donc l’estimateur E, (2x, 


X w) est sans biais et optimal. En écrivant : 


r (7 


n—] 
1 n—l 1 
X) ur, 4 — DEC Xe) 


on établit que E, (2x, Xw) = LÉ X 
n 
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Un estimateur est une statistique, c'est-à-dire une variable aléatoire fonc- 
tion d'un échantillon, dont les réalisations sont censées être proches de 
la valeur inconnue du paramètre à estimer. Pour qu'il en soit ainsi, on 
demande à cet estimateur de posséder un certain nombre de propriétés, 
comme par exemple d'être sans biais, i.e. d'avoir une valeur moyenne 
(au sens d'espérance) égale au paramètre à estimer. On souhaite ensuite 
qu'il soit le plus efficace possible, i.e. qu'il ait une dispersion, mesu- 
rée par la variance, la plus petite possible. Dans certaines conditions, 
notamment quand l'ensemble des valeurs possibles pour la variable 
ne dépend pas du paramètre à estimer, on peut trouver un estimateur 
optimal, qu'on appelle efficace, et qui est le meilleur estimateur sans 
biais que l'on puisse obtenir. 


Si un estimateur est seulement asymptotiquement sans biais, i.e. que 
son espérance tend vers le paramètre quand la taille de l'échantillon 
devient infinie, sa qualité est mesurée par l'erreur quadratique moyenne. 


Un estimateur est dit convergent s'il converge en probabilité vers le 
paramètre à estimer. Tout estimateur sans biais, ou asymptotiquement 
sans biais, dont la variance tend vers zéro est convergent. 


Si le paramètre à estimer est la moyenne (espérance) de la loi, la 
moyenne empirique est un estimateur sans biais et convergent. 


Si le paramètre à estimer est la variance de la loi, la variance empirique 
modifiée (divisée par n — 1 au lieu de n) est un estimateur sans biais et 
convergent. 


Dans les autres cas, on construit un estimateur par la méthode des 
moments ou la méthode du maximum de vraisemblance. 
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7.1 


7.2 


7.3 


7.4 


7.5 


7.6 


Entrainez-vous (@) 


À partir d'observations indépendantes (X 1» X,) d’une certaine grandeur écono- 
mique X, on retient le modèle suivant : 


X,=a(l+e,), 1<t<n 


où les v.a. £, sont indépendantes et de même loi normale standard. 

1. Déterminer l’estimateur du maximum de vraisemblance 4, de a. 

2. Étudier les propriétés de l’estimateur de a obtenu par la méthode des moments. 

3. Proposer un estimateur de la variance du modèle. 

Afin d'organiser au mieux l’accueil des groupes de visiteurs d’un parc d’attractions, on 
note la durée X séparant l’arrivée de deux groupes successifs. À partir des observations 
(X,,.…., À,) recueillies dans une journée, on retient comme modèle la loi uniforme sur 
[0,4]. 

1. Déterminer par la méthode des moments un estimateur sans biais du paramètre 9 > 0 
et étudier ses propriétés. 

2. Déterminer par la méthode du maximum de vraisemblance un estimateur sans biais 


du paramètre 0 et étudier ses propriétés. Comparer les deux estimateurs. 


Une v.a. X suit une loi uniforme discrète sur l’ensemble des entiers {1,2, 0} où @ 
est un entier positif inconnu. Déterminer, par la méthode des moments, un estimateur 
de 8 construit à partir d’un échantillon (X,,..., X,) de X et étudier ses propriétés. Est-il 
efficace ? 


Une urne contient un nombre de boules inconnu 8 > 2, une seule d’entre elles étant 
blanche. On effectue dans cette urne des tirages successifs avec remise, jusqu’à ce 
qu’on obtienne une boule blanche et on note X la variable aléatoire qui représente le 
nombre de tirages effectués. À partir d’un échantillon (X 1 X,) de X, déterminer un 
estimateur 7, de 8 par la méthode des moments. Étudier ses propriétés. Est-il efficace ? 


Soit X une variable aléatoire dont la densité a pour expression, pour x > 1: 
IETTE 
fO= Ex 1/0-1 avec 8 > 0 


et nulle sinon. 


1. Calculer E(X) et en déduire un estimateur T, de 8 par la méthode des moments, 
construit à partir d’un échantillon (X re. € " de X. 


2. Déterminer la loi de probabilité de la variable aléatoire Y = InX. 


3. Déterminer l’estimateur 4, du paramètre 0 par la méthode du maximum de vraisem- 
blance et étudier ses propriétés. Est-il efficace ? 


4. On pose X, = 2 In X,. Déterminer la loi de probabilité de 2X,,/0 et en déduire un 
intervalle de confiance bilatéral pour 8 de niveau 1 — «. 


Le total des ventes hebdomadaires d’un produit alimentaire dans un magasin i, 
1<i<n,estune va. X; de loi normale N(m;, o) où les valeurs m; et o sont supposées 
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connues. Une campagne publicitaire de ce produit a pour conséquence d’augmenter les 
ventes, de telle sorte que chaque moyenne m; est augmentée d’une même quantité a. 
1. Déterminer un estimateur de a construit à partir d’observations indépendantes 
(X Des À a) des ventes après cette campagne et étudier ses propriétés, puis construire 
un intervalle de confiance de niveau 0,95. 

2. Déterminer un estimateur du paramètre b dans le cas où chaque moyenne m; est cette 
fois multipliée par b et étudier ses propriétés. 


3. Application aux données suivantes dans le cas où o = 3. 


m, | 98 101 104 99 100 102 95 97 105 103 


x; | 109 105 110 106 110 114 108 104 115 118 


i 


La durée de vie d’un certain matériel est représentée par une v.a. positive X de densité : 


fG:0) geo si x >0 
X,; = 
0 si x <0 


où 8 est un paramètre inconnu strictement positif. 


Étudier les propriétés de l’estimateur du maximum de vraisemblance ô, construit à 
partir d’un échantillon (X,,.., X,) de la va. X. 

Construire un intervalle de confiance pour 0 de niveau 0,95 dans le cas où les 
observations ont conduit à pe x; = 11,5. 

Soit (X 13:55 X,) un échantillon d’une va. X de loi log-normale de paramètres m et 
6 > 0. 

Étudier les propriétés de l’estimateur du maximum de vraisemblance de m. 
Construire un intervalle de confiance pour m de niveau 0,95 dans le cas où © = 1 etoù 


on a observé >. In x; = 54,94. 


Soit X une v.a. de densité : 


ja _ si0<x<0 
x; 0) = 


0 sinon 


où 0 est un paramètre strictement positif. 

1. Déterminer un estimateur de 0, par la méthode des moments, construit à partir d’un 
échantillon (X,,..., X,) de X, et étudier ses propriétés. 

2. Déterminer un estimateur sans biais ô, de #, construit à partir de l’estimateur du 
maximum de vraisemblance, et étudier ses propriétés. 

3. Construire un intervalle de confiance de niveau 0,95 pour @ dans le cas où on a 


observé max {x1,...,X20} =5. 


Deux ateliers de fabrication produisent des doubles-vitrages dont l’épaisseur peut être 
considérée comme une v.a. de loi normale d’espérance m = 6 mm, soit pour chaque 
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atelier les v.a. X et Y de lois respectives N(m, 0.) et N(m,o;). Pour comparer les 
caractéristiques de fabrication de chacun de ces ateliers, on prélève respectivement n; 
et n,vitrages d’épaisseurs notées X1,...,X, et Y,,...,Y,. Construire un intervalle 
de confiance de niveau 1 — « pour le rapport 6? / 6 
Soit (X 3% ) un échantillon d’une v.a. X de loi normale d’espérance et de variance 
égales à un paramètre inconnu 8 > 0. 
1. Déterminer deux estimateurs de @ par la méthode des moments, étudier leurs proprié- 
tés et les comparer entre eux. 
2. Construire un intervalle de confiance pour @ de niveau 0,95 ayant observé : 

25 25 

x,=50,23 et Y'(x;-x) = 48,12 
i=1 i=1 


Soit X une variable aléatoire dont la densité a pour expression : 


JG = Set 


où 0 est un paramètre réel strictement positif. 

1. Déterminer l’estimateur ô, du paramètre 8 par la méthode du maximum de vraisem- 
blance, construit à partir d’un échantillon (X is À :) de X et étudier ses propriétés. 
Est-il efficace ? 

2. On pose X, = >°_, |X;|. Déterminer la loi de 26 ;, et en déduire un intervalle 
deconfiance bilatéral pour 8 de niveau 1 — a. 

3. Déterminer la loi limite de ô, et en déduire un intervalle de confiance bilatéral pour 
0 de niveau voisin del — «. 


Soit X une v.a. de densité : 


: eVx/8 six > 0 
fG:0)=41204Vx 
0 


si X <0 

où 6 est un paramètre strictement positif que l’on se propose d’estimer à partir d’un 
échantillon (X,,..., X,) de X. 

1. Déterminer l’estimateur du maximum de vraisemblance ô, de 0 et étudier ses 
propriétés. 

2. Construire un intervalle de confiance de niveau 0,90 pour 8 dans le cas où on a 
DE, VF = 47,4 


Soit (X, Ÿ) un couple normal dont la densité est définie par : 


1 
f@y)= 
27 V0 


1. Déterminer la loi de X + Y et en déduire un estimateur T,, de @ par la méthode des 
moments construit à partir d’un échantillon de taille n du couple (X, Y). 


exp [CL +0) x2 + 2(1 + 28) xy + (1 +40) y°] 


2. Étudier les propriétés de T;,. Est-il efficace ? Déterminer la loi de T, et en déduire un 
intervalle de confiance bilatéral pour @ de niveau 1 — «. 
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3. Déterminer la loi limite de T, et en déduire un intervalle de confiance bilatéral pour 
0 de niveau voisin del — «. 


Soit X une v.a. de densité : 


f (0) = Q 
0 sinon 
où 8 est un réel strictement positif. 
1. Calculer E(X) 
2. Soit X,,...,X, des v.a. indépendantes, de même loi que X. Déterminer un estima- 


teur T,, de 8 par la méthode des moments. Étudier ses propriétés. Est-il efficace ? 


3. Déterminer la loi limite de T;, quand n devient infini et en déduire un intervalle de 


confiance bilatéral symétrique de niveau voisin de 1 — « = 0,95 pour 6, dans le cas où 


on a observé la valeur > x; = 660 sur un échantillon de taille n = 100. 


Solutions © 


® 7.1 1.Les va. X, suivent la même loi normaleN (a, a), donc la log-vraisemblance a pour 
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expression : 
1 
nL (x1, 2e tra) = -; nr) —nlna- 2 » (&, — a) 


de dérivées : 


oinL n 1 2 1 
= —— + — (x, a) Fi (x, — a) 
2 
0a CRT (Dr 
2 In L LR ST h es: L 
A à A2 de 2 Var 
1= = 
Nous allons poser 
1€ 1 
X=- x, et s = - (x,-x) 
n n 
t=1 1=1 
On peut écrire : 
1+ 2 2 
J : à _ 
: (x, a) S + (x a) 
t=1 
et on obtient alors : 
olhL n Ca . 
= — + x ax — a 
0a a 
dInL _n 2nx 3nf, n 
rate 0 


Lo 7 : _ 1/2 = ss 
La dérivée première admet comme racine positive a = : ( 5x" +52 — x) qui vérifie 


—2 . Die . 
s'2+%" = a? + ax et donc la dérivée seconde admet comme valeur en ce point : 


a vraisemblance est donc maximum en ce point, l’expression de l’emv étant donc : 
L bl t d t,l de l tant d 


2 1 1\/ 4 D _Y 
dn = 2 5X L + S n — X n 
2. L'expression précédente est beaucoup trop compliquée et il est préférable d’utiliser 


la méthode des moments puisque a = E(X). On peut donc prendre comme estimateur 
sans biais et convergent le moment empirique X’,. Calculons l’information de Fisher : 


I, (a) = E Ch) sors ‘ LE(X,)+E (5°)] 


da? a dd a 
_— —_ 
avecE (x,) =F (x,)=* = — SE et E su R— 1,2 6n obtient : 
n 
I, (a) es 
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7.2 


Ainsi : 


donc cet estimateur n’est pas efficace. 
3. Le modèle a pour variance a dont un estimateur sans biais et convergent est Ne On 


: | à 2e. * HN 
pourrait prendre aussi comme estimateur X, qui, d’après ce qui précède, est un 
estimateur asymptotiquement sans biais de a2. 


1. Comme E(X) = ï- l’estimateur est obtenu par la méthode des moments comme 


solution de l’équation X, = soit 7, = 2%; Cet estimateur est sans biais et 
convergent, de variance : 
V (x) _ 0? 
n 3n 
La question de l’efficacité d’un estimateur ne se pose pas ici car nous ne sommes pas 


dans les conditions d’application de l’inégalité FDCR, l’ensemble des valeurs possibles 
pour X étant X (Q) = [0, 0] qui dépend donc du paramètre à estimer. 


V(T,)=4v (x) =4 


2. La vraisemblance a pour expression : 


L( 0) 0" si0 <minx, < max x; < 0 
X , , X ; = . 
L É 0 sinon 


Ainsi, L est nulle pour 8 < max x; et ensuite est décroissante pour 4 > max x; , donc 
est maximum pour Ÿ = max x; , ce qui correspond à l’emv : 


M,=max{X;,,...,X,} 
Pour étudier ses propriétés, nous devons déterminer sa loi de probabilité : 
n n 
P(M,<x)=P4(M(Xi<x) = [[P(X<x) = Fr" 
i=1 i=t 


en raison de l’indépendance et de l’identité des lois des v.a. X°;, de fr. F. La densité de 
M, est donc : 


nx""l 
— si0<x<0 
GO =nF" G)f()=4 6" 
0 sinon 
Par conséquent : 
4) 4 n 
E(M,,) = — "dx = 0 
(4,) on l El 
et l’estimateur sans biais est donc : 
6, nt 1 M, 
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Pour calculer sa variance, on calcule d’abord : 


d’où on déduit : 


M,) = "6 
Vu) (n + 1)2(n + 2) 
puis : 
SE 0? 
V@,) = n(n +2) 


ce qui montre que ô, est convergent. Le rapport : 


vé,) _ 3 


= = 0 
V(T) n+2 


montre que ô, est infiniment plus efficace que T,. 


La va. X admet comme espérance E(X) = 2. La méthode des moments consiste à 


écrire l’égalité entre moment théorique, ici l’espérance, et moment empirique corres- 
pondant, ici la moyenne empirique X,. On résout donc l’équation en 8 : 


—— =X, 

La solution donne l’estimateur T, = 2X, — 1. Cet estimateur est sans biais : 
E(T,)=ECX,-1)=2E(X,)-1=2E(X)-1=0 
Il est aussi convergent d’après la loi des grands nombres : 
LEE ET 

p 2 

On en déduit du théorème de Slutsky que : 
T,=2X,-1-2E(X)-1=0 
P 


La question de l’efficacité ne se pose pas puisque l’ensemble des valeurs possibles pour 
X est {1,2,...,0}, qui dépend du paramètre à estimer 0. 


La v.a. X suit une loi géométrique de paramètre p = n donc avec : 
1 1-p 
E(X) = - =0 FÉES =D) 
P P 
Le paramètre à estimer est la moyenne théorique, donc l’estimateur T,, de @ par la 


méthode des moments est la moyenne empirique X,. Cet estimateur est sans biais et 
convergent d’après la loi des grands nombres. Pour savoir s’il est efficace, on détermine 
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d’abord l’expression de la vraisemblance : 


n 


LGn.,x50)= [[PAX;=x)= [pt - "7 


i=1l i=1l 


6-1)" 
= PO UT EE — 


ayant posé 5, = D x;. La log-vraisemblance est donc : 
InL(x;,...,x,; 0) = té, L n) In (0—1)—5s,In0 


Soit en dérivant : 


On dérive une nouvelle fois : 


dnL Sn Sn 
002 (@—1) 02 
On calcule alors la quantité d’information de Fisher : 
2 E(S,) — ECS _ 
ROSE (-TRE) - (S,) n = (Sn) _ n0 n _n0 _ n 
002 (8 —1)2 02 (8-12 02 6(8—-1) 


Par ailleurs : 


V(T,)= V(X,) = 


V(X) __0(@—1) _ 1 
n n 1,(0) 
L’estimateur T,, est donc efficace. 
7.5 1. On obtient : 


1 + _10 1 
E(X) = 0 X dx = T=d 
1 = 


sous réserve que cette intégrale soit convergente, c’est-à-dire que 1 — 1/0 < 0 soit 

0 <8<I. 

L’équation X, = 1/(1 — 8) donne comme solution l’estimateur T,, = 1 —1/X,. 

2. La va. Y est positive, donc G(y) = P(Y < y) = 0 pour y < 0. Pour y > 0: 
G(y)= P(InX <y)= P(X <e’)=F(e) 


où F est la f.r. de X. La densité obtenue par dérivation est : 
80 = ee) = 5e 7/0 


qui est la densité de la loi exponentielle de paramètre 1/0. 
3. L'expression de la vraisemblance est : 


Lane 3,0 = [[ fa = () (11) 
i=1 


i=1 


_1-1/0 


La log-vraisemblance s'écrit : 


n 
In Le % 50) = =n In 6 (1+ 5) Ynx, 
i=1 
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Cette fonction est dérivable pour tout 0 > 0 avec : 


D HS, À 
90 =-5 +73 2x 


La dérivée s’annule pour 8 = > In x;/n; la dérivée seconde est négative pour cette 


valeur : 


mL _n 2% 
D np 2x 


L’estimateur du maximum de vraisemblance est donc : 
1 n 

BD 
= 


Cet estimateur moyenne empirique est un estimateur sans biais de la moyenne théorique 
de Y et convergent d’après la loi des grands nombres. 
Sa variance est : 
0 
VY,)= —— = — 
n n 


La quantité d’information de Fisher est : 
2 
1,0) = E (-2) nr DE ds 


L’estimateur est donc efficace. 


4. La va. X, est la somme de n v.a. indépendantes et de même loi y(1, 1/8) donc suit 
une loi 7(n, 1/0). On en déduit successivement que =, /8 suit une loi 7(n) et que 2X,/0 
suit une loi y(n, 1/2) qui est la loi ee (cf. chap. 3, 2.4 et 2.5). On en déduit un intervalle 
de confiance bilatéral pour @ par la condition : 


25, 6, 6, 
1-a=P4ia< <b;j=P42n— <0 <2n— 
0 b a 


a et b étant les fractiles d’ordres respectifs «/2 et 1 — «/2 de la loi es 


1. Chaque variable X; suit une loi Nm; + a,o), 1 < i < n; les variables Y; = 


X;-— m; constituent donc un échantillon d’une v.a. Y de loi N(a,o). Par conséquent, 


l’estimateur : 


est un estimateur sans biais et convergent du paramètre a. 


L'expression de la log-vraisemblance est : 


n 
Het au Ne | 
In L(ky.….,x, a) = 7 In (270?) 2 26 m; — a) 
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de dérivées : 


n 
oln L 1 
= — X;j—Mm;—a 
= 2 ;— M 4) 
dn£L. On 
0 a? o2 
On remarque ainsi que 4, est un emv et qu’il est efficace car : 
2 1 
V(a,)= — = 
(C7) T0 
puisque : 
ML n 
I,(a = = 
(@) ( 0 a2 ) o? 


On obtient un intervalle de confiance à partir de 4, dont on connaît la loi, qui est la loi 


normale N(a, o/Vn) : 


A o A o 
dj -uU— <a<Aa, +u— 
Vn Vn 
où u est le fractile d’ordre 1 — «/2 de la loi N(0, 1), soit u = 1,96 pour a = 0,05. 
2. Les variables Z; = X;/m; sont indépendantes et de loi N(b, Æÿ donc la statistique : 


i 
15 y X; 
r& = 5 2m 


est un estimateur sans biais et convergent, de loi normale d’espérance b et de variance : 


" ls 02 
V(b,) = 72 72 
Lars m; 
La log-vraisemblance a pour expression : 
In Lx, .…., 2,5 b) = = 3 nQx0?) — = — Du — bm,Ÿ 


de dérivées : 


n 
on L 1 
5b = = 2 m;(x; — bm;) 


nE 
= RD 


donc l’information de Fisher a pour expression : 


2 n = 
ME) me = 
Z 


ob? er o? 
en ayant a. m = - LD 1; . La variance de l’estimateur peut aussi s’écrire 
v (6, ) = —, en ayant noté par h la moyenne harmonique des nombres m? , définie par 
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1 __Iymn 1 sh) uns De : 

os D nm Comme les moyennes arithmétique et géométrique vérifient toujours 
L 

la relation h < m, on en conclut que : 


1 
VO,)> —— 
1,() 
c’est-à-dire que cet estimateur n’est pas efficace, sauf dans le cas particulier où tous les 
m; sont égaux. 


3. L’estimation 45, = 9,5 conduit à l’intervalle : 
7,64 < a < 11,36 


On obtient #9 = 1,095. 


Nous avons vu dans l’exemple 7.8 que l’emv est 4, = X,, qui est donc un estima- 
teur sans biais et convergent, comme toute moyenne empirique lorsque le paramètre à 
estimer est la moyenne théorique, avec ici : 

A 0? 
FO,y=— 


n 
La quantité d’information de Fisher a pour valeur : 


) __n ,2nE(X) _n 
902 


1,(0) = E ( o2 PE a 02 


Donc cet estimateur est aussi efficace. 

Pour construire un intervalle de confiance basé sur ô, on a besoin de connaître sa loi 
de probabilité. On va pour cela utiliser le fait que la loi exponentielle appartient à la 
famille des lois gamma : X- €(1/0) = 7(1,1/8). Utilisant l’une des propriétés des 
lois gamma on en conclut que S, = X}_, X; + 7(n,1/6)et donc S,/0 + y(n). Le 
résultat du chapitre 3 $2.5 permet de recourir aux tables des lois usuelles puisqu'on y 
a établi que 2S,/0 + ei . On peut donc déterminer deux valeurs a et b telles que : 


35 
D HE =l-a 


et déduire de là l’intervalle de confiance de niveau 1 — « : 
25, 25, 
b 
En choisissant des risques symétriques, pour « = 0,05 on lit dans la table 5 les fractiles 


d'ordres respectifs 0,025 et 0,975 de la loi #0 :a= 9,59etb = 34,17 d’où l'intervalle 
0,67 < 0 < 2,40. 


<0< 


La log-vraisemblance à pour expression (cf. chap. 3, 2.7) : 


n n 
n 2 1 2 
I RCE ; == | s l rene I LS 
n L(x; X,,m) = —=In(2xo") à n x; : Zn x m) 


235 


Statistique et probabilités 


de dérivées : 


om 0° i=1 
d?InL n 
Om o? Se 


donc l’emv est : 


n 
ze, DA 
My = 120% 


Or on sait, par définition de la loi log-normale, que In X - N(m,o) donc cet 
estimateur est sans biais et convergent, de variance : 


62 


AU) = 2 


donc il est aussi efficace puisque 1,(m) = _. Il suit la loi N(m,c/ 4/7) d’où l'intervalle 
de niveau 0,95 : 


Pi, — 1,96-2 < m < fi, + 1,96 
n n 


soit pour 6 = letn=25:1,81 < m < 2,59. 
7.9 1. On calcule : 


0 
E(X) = 2 [ Pix = <0 
0 


et l’estimateur sans biais est solution de l’équation en 0, x: = 56, soit : 


3—— 
T, — 2 n 
qui est sans biais et convergent d’après la loi des grands nombres. On peut calculer sa 
variance à partir de : 

0 
2 1 
2 À 34x = =02 
ex = E | x”dx 5° 


— 2 
d’où V(T,,) = VX) _ VX) = de. La question de l’efficacité ne se pose pas 


ici car les hypothèses de Cramer-Rao ne sont pas vérifiées, X(Q) = [0, 0] dépend du 
paramètre à estimer. 


2. La vraisemblance a pour expression : 
2\"r 
Lex, 20) = (à) Il: pour 0< min x; < max x; < 0 
i=1 


elle est donc nulle pour 0 < max x; et décroissante pour 8 > max x; ce qui montre que 
l’emv est : 


M,=max{X;,...,X,} 
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Pour étudier ses propriétés nous devons déterminer sa loi de probabilité : 


P(M, < x)= P {de < »} = 
i=1 


en raison de l’indépendance et de l’identité des lois des v.a. X; de fr. F. La densité de 
M, est donc : 


PIX, < x) = F"(x:0) 


n 
i=1 


8:06) = n F1: 0) f(x: 0) 


La fr. de X étant définie par : 


0 six<0 
%2 
F(x; 0) = si 0<x <6 
1 si 0 < x 
Par conséquent : 
x2n7 1 . 
(x: 0) = on si 0 <x<0 

0 sinon 


et : 


0 
2n On 2n 
E(M,) = — dx = 
( n) g2n X X DE 


L’estimateur sans biais est donc : 


dont la variance se déduit de : 
6 
E(M?) = | AT se M Cp 
o2n 0 


soit : 
0? 
7 OnQn+2) 
Cet estimateur est donc convergent et infiniment plus efficace que T,,, au sens où : 
v(6,) 2 
= ——— = 0 
V(T,)) n+1 


) vou) 


2 _[2n+1 
re (7, 


3. Nous allons construire un intervalle de confiance à partir de M, dont la loi est connue, 
de fr. : 


0 six<0 
x2n | 

G(x; 0) = ro si0 < x < 0 
1 si0 <x 
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Nous cherchons a et b tels que 1 — «x = P(0a < M, < 6b) ou tels que 
a, = P(M, < 0a) = G(6a; 0) et «; = P(M, > 0b) = 1 — G(0b; 0) avec a; +a3 = «, 
ce qui va définir a et b par : 


et b=(1-a)l/?" 


; 1/2 
d =a",1— 0, = b" soit a= a” 


d’où l'intervalle de confiance : 


n 


b 
Application : a = 0,91, b= 0,999 soit l’intervalle 5,00 < 8 < 5,48. 


n 


<0< 


7.10 Les estimateurs sans biais de o? et o? sont respectivement : 
1 2 
1 € 1 
G2=— V(x,-m) et 62=— DT, - my) 
Mia "2 = 
dont les lois sont données par 167 / Gi de et m6; / Cros 4 Les deux échantillons 


étant indépendants, on sait (cf. chap. 5, $ 3.2) que (6°/o?) / (63/03) F(n,n2) donc 
l'intervalle de confiance est défini à partir de : 


& 0 
1-a=P M Ne 0 


95 194 
soit : 
22 2 22 
k:: 01e "07 0j 
b X =. < 5 < — X D 
a 
53 53 


7.11 1. Comme E(X) = V (X) = 8 , on peut retenir comme estimateurs sans biais de 0 les 
moments empiriques : 


Ces deux estimateurs sont aussi convergents, de variances respectives : 


202 


n—-]1 


VvXp= et v(S2) = 

n 
Le rapport v(S2) / v(X,) tend vers 20 quand n devient infini, valeur inconnue qui 
ne permet pas de comparer ces deux estimateurs. Etudions leur efficacité en écrivant 


d’abord la log-vraisemblance : 


n 
n n 1 
In LGcise,%50)= 5 m27- 5 M0 2-07 
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7.12 


Estimation 


puis en dérivant : 


nL_n 


1 
002 202 63 


IM- 
# 
S 


D'où la quantité d’information de Fisher : 


1,(0) = E (2 .. nn r Lis 


002 202 03 
soit, avec E(X?) = V(X) + EX) = 0 + Le : 
ra 
I1,(0 — 
n@) = TE +5 


On voit ainsi que : 


< 1,(0) et 
va) "9% y 


donc aucun de ces estimateurs n’est efficace. 


<1,(8) 


2. Pour construire un intervalle de confiance, nous allons utiliser le fait que 
(cf. chap. 5, 3.1) : 


ce qui permet de déterminer les valeurs de a et b telles que : 
P ( ) =l-a 


FA S, FA Sy 
X,-b— <0<X,-a— 
Vn Vn 
Pour à = 0,05 on retient des risques symétriques puisque la loi est symétrique et on 
lit dans la table 6 les fractiles b = —a = 2,064 avec x,5 = 2,01et ss = 1,42 d’où 
l'intervalle : 


d’où l'intervalle : 


1,42 < 0 <2,59 


1. L'expression de la vraisemblance est : 


n n 
0 n 
L(x,,...,x,:0) = [70 = (5) exp {- > x; | } 
i=1 i=1 
La log-vraisemblance s'écrit : 


n 
In Lx .….,x,:0)=-nIn2+nm0-0 © |x| 
i=1 
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Cette fonction est dérivable pour tout 0 > 0 avec : 


n 


omL n 
mn 0 2h 
i=] 


La dérivée s’annule pour 0 = n/ > |x;| ; la dérivée seconde est négative : 


dInL Lt 
00? 02 
L’estimateur du maximum de vraisemblance est donc : 
PS n 
0, = 


n 
Z IX 
i=1 


Pour étudier les propriétés de cet estimateur nous allons déterminer la loi de U = 0|X|. 
La fonction de répartition est nulle pour u < 0 et définie pour u > 0 par : 


Gt) = P(U <u)=F (5) _F (-5) 


D'où une densité définie par : 
2 U\ _ 
UE 0) au 


Il s’agit donc de la loi exponentielle ou loi 7(1). Par conséquent S, = @ D [X;| suit la 
loi 7(n). Un calcul intégral nous permet alors d’obtenir : 


LS OR Lo 1 
(+) UE Een ren 


L’estimateur s’écrivant sous la forme 0, = n0/S,, on en déduit : 


n? 2 


Pa h Pa 
POESIE 
(6) n—] F (n — 2)(n — 1)2 

Cet estimateur est biaisé, donc il ne peut pas être efficace. Il est asymptotiquement sans 
biais et de variance qui tend vers O, donc il est convergent. 

2. On a X, = S,/6 qui suit donc la loi y(n, 0) et donc 260, suit la loi y(n, 1/2) ou loi 
Lo (cf. chapitre 3 $ 2.4 et 2.5). On en déduit un intervalle de confiance bilatéral pour 
0 par la condition : 

Be 


b 
1-axa=P{a<202, <b! =P <O< — 
d, ta : ) (Æ à} 


a et b étant les fractiles d’ordres respectifs «/2 et 1— «/2 de la loi Re 


3. On déduit de la question 1 que E(|X|) = 1/8 et V(IX|) = 1/02. L'application du 
théorème central limite à 1/0, permet donc d’obtenir : 


1/8 —1/0 
Nr 


D NO 
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7.13 


En appliquant la propriété 2.7 du chapitre 6 on en conclut : 


re 


On en déduit un intervalle de confiance bilatéral pour 8 par la condition : 


6,0 
arf vi cu} 


Ô —0 


— N(0,1) 
loi 


où u est approximé par le fractile d’ordre «/2 de la loi normale centrée réduite. 


L’intervalle est : 


A A 


On 0 
— < 0 < ——— 
l+u/Vn 1—u/\n 


1. La vraisemblance s’écrit : 


n n 
LG x0) = CO TT x exp À x 
i=1 i=1 


d’où la log-vraisemblance : 


n n 
1 1 
In L(X;,.….,x,;0) = -nm2-nin0 — PUS UE "où NET 


et ses dérivées : 


Estimation 


LE 2 5x ; _ lv LA 
La dérivée première s’annule pour 0 = - 1 V/x; avec une dérivée seconde en ce 


point de valeur —n/ @?, donc l’emv est : 
1 n 
6, = : > VX; 
i=1 


Pour étudier ses propriétés, nous allons déterminer la loi de la v.a. Y = VX: 


G(:0)= P(Y < y) = P(VX < y) = P(X < y?)= F(ÿ/:0) 


pour y > 0. Sa densité est alors définie par : 


1 
g(»:0) = 2yf (7; 0) = j° »/0 


donc Y + €(1/0) et l’estimateur ô, = Y, est un estimateur sans biais et convergent de 


0 = E(Y), de variance 02/n. 
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L'information de Fisher se calcule par : 


2 n 
10 = E (— DE ) = n ,2n Lun 


donc 8, est efficace. 


2. Pour construire un intervalle de confiance à partir de ô, on utilise le fait que 
Y#€(1/0) = y(1, 1/0) donc n6, ->y(n, 1/0) puis n0,/0 ->y(n, 1/0) et enfin (cf. cha- 
pitre 3 $2.4 et 2.5) 2n0,/0 . On peut donc trouver deux valeurs a et b telles 


que : 
2n6, 
1-a=Pla< F <b 


ce qui permet d’obtenir l’intervalle : 


2n. 2n0. 
M '<O< — 


a 


Pour & = 0, 10 et en prenant des risques symétriques, on lit dans la table 5 : a = 26,51 
et b = 55,76 ; on obtient par ailleurs 4,6, = 2, 37 d’où l'intervalle : 


1,70 < 0 < 3,58 


intervalle très grand en raison de la faible taille de l’échantillon. 


1. D’après l’exemple 4.13 et la forme de la densité on sait que X et Y suivent des lois 
normales centrées et de variances respectives 1 + 48 et 1 + 06. 

On a de plus Covu(X,Y) = —(1 +20). 

D’après la définition de la loi normale vectorielle, X + Y suit une loi normale. Cette 
loi est centrée, avec : 


VIX+Y)=V(X)+V (N)+2Cov(X,Y)=0=E(X+YY 


L’estimateur est donc : 
1 n 
=: DA +ry 
i=1 


2. Cet estimateur est sans biais et convergent d’après la loi des grands nombres. On 
sait également que nT,,/8 suit une loi fe et donc V(T,) = 20?/n. Pour savoir s’il est 
efficace, nous devons calculer la quantité d’information de Fisher. L'expression de la 
vraisemblance est : 


n 
Lt: Vas ee %p 330) = [] fc, 7) 


i=1 


n n 
1 1 2 2 
= ( ) Ep 210 + 0)x; +201 +20)x;y; + (1 +40)y;1 


2x V0 i= 
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7.15 


Estimation 


La log-vraisemblance s’écrit : 


In Lx, Ye Xm)n:0)= nn 2x - 5 In O) 
n 
1 
> DIE + 0)x2 + 2(1 + 20)x;y, + (1 + 40)y2] 
i=1 


Cette fonction est dérivable pour tout 0 > 0 avec : 


n 
olnL n 1 2 
= —— + — - + y; 
06 20 Ÿ 202 26: 75) 
La dérivée seconde est : 
dinL fi 


n 
1 à 
20 p 2) 
i= 
La quantité d’information de Fisher est donc : 


In L n  1+ n 


L’estimateur est donc efficace. 
L’intervalle de confiance bilatéral pour 9 est obtenu par la condition : 


T, T, 
lus P{a<nro<t}=P{Tt<o<" 2} 
a 


a et b étant les fractiles d’ordres respectifs «/2 et 1 — «/2 de la loi LR 
3. L'application du théorème central limite à T,, permet d’obtenir : 


T,-0 
Vn a = N(O.1) 


On en déduit un intervalle de confiance bilatéral pour 8 par la condition : 


1 2 < m0 } 
— X = —U n U 
ov2 


où u est approximé par le fractile d’ordre «/2 de la loi normale centrée réduite. 


L’intervalle est : 
T T. 


Rp 
1+u/V2/n 1-u/V2/n 


1. L’espérance se calcule par : 


: +00 _…. +00 x—0 
EG = | «rGOdx = 7 fl xexp— (=) dx 


CO 
On fait alors le changement x — 0 = Ou, puis on intègre par parties : 


+oo 


+oo 
E(X) = 0 j (1 +u)e “du = 6 [-(+u)e"]5 +0 1 e-“du = 20 
0 0 
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2. L’estimateur T, de 8 obtenu par la méthode des moments est solution de l’équation 
en 4: 


280=X, 
Il s’agit donc de T,, — SX Il est sans biais par construction : 
E(r)=lr (x,) = LE(X) = 0 
2 2 
Il est convergent d’après la loi des grands nombres : 
X,,— E(X) = 20 
p 


Donc : 


1= 1 


La question de l’efficacité ne se pose pas puisque X prend ses valeurs dans l'intervalle 
[, +oo[ qui dépend de 6. 
3. D’après le théorème central-limite : 


X,—E(X) 
Ve — > N(O, D) 


On doit calculer la variance de X : 


E (X?) = [" x? exp — (=) dx 
0 Jo 0 
On fait alors le changement x — 0 = Ou puis on intègre par parties : 


+0 
E (x?) = 6? | (1+u)e “du 
0 
+00 
= 8 [-(1+uÿe"]5" +202 | (1+u)e “du 
0 


= 0? +20E(X) = 50? 
Ainsi, V(X) = 6? et on obtient : 
X, — 26 


A 


T0 
2 


07 — N(0,1) 


loi 


L’estimateur T,, suit asymptotiquement la loi normale N (e } On construit donc 


no 
2Vn 
un intervalle de confiance bilatéral symétrique, puisque cette loi est symétrique. On 
peut trouver la valeur approchée de la constante u telle que : 


T,-0 
as P(-u< v TE <u) 


L’intervalle de confiance est alors défini par : 


—0 


E <T,-0<0 £ 


24V/n 2Vn 
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Estimation 


Ce qui est équivalent à : 
T T 
a <0< ET — 
1+u/2Vn 1—u/24/n 
où u est approximé par le fractile d’ordre 1 — : de la loi normale standard N(0, 1). Pour 


1 — à = 0,95 on retient la valeur approchée # = 2; pour cet échantillon f,59 = 3,3 
d’où l'intervalle 3 < 0 < 3,67. 
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Chapitre &; ‘ 
Tests d'hypothèses 


CECECES CCE EEE CECECELEE TE CETELELEELELECEEC ELEC EE ELECECE EEE CEE ECENES CEETETECEECELELEELCELEC) es, 


Æ Introduction 


On appelle théorie des tests la seconde branche de la statistique mathématique, celle 
qui permet de confronter deux hypothèses retenues a priori. Comme dans le cadre d'un 
È problème d'estimation, on retient un modèle statistique où la v.a. X suit une loi de proba- 
bilité P,, qui dépend d'un paramètre 8 inconnu. On dispose cependant ici d'informations É 
supplémentaires qui font penser à priori que la valeur de ce paramètre est égale à une 
valeur fixée 4, et on cherche à valider (à tester) cette hypothèse, au vu d'un échantillon de 
la loi de X. Cette hypothèse qui est privilégiée, parce qu'elle paraît la plus vraisemblable 
a priori, est appelée hypothèse nulle et notée H,. Construire un test va consister à parti- 
tionner l'ensemble R" des réalisations possibles du n-échantillon en deux régions, celle où 
l'on décidera d'accepter H,, et celle où l'on décidera de la rejeter, qui se nommera région 
critique du test. Pour délimiter ces deux régions, on fixe a priori une valeur (faible) à la 
: probabilité de l'erreur qui consiste à décider, au vu de l'échantillon, de rejeter l'hypothèse 
nulle alors que celle-ci est vérifiée. Cette probabilité se nomme risque de première espèce 
et sa valeur standard est de 5 %. Lorsque le paramètre 9 ne peut prendre que deux valeurs 
: distinctes 4, et 4,, c'est le théorème de Neyman et Pearson qui permet de déterminer la  : 
? forme de la région critique, à partir du rapport des vraisemblances associées à chacune 
? des deux valeurs possibles du paramètre. Dans le cas où on peut attribuer des probabilités 
a priori à ces deux valeurs, ainsi que des coûts d'erreur, on utilise la méthode de Bayes. E 


comment, à partir È È Hypothèses nulle et alternative 
d'observations indépendantes on peut È È Région critique 
choisir entre deux hypothèses relatives 
à la valeur du paramètre qui caractérise 
la loi retenue dans le modèle. 
et Pearson 


É un test d'indépendance de ; st dobhidenx s 
a deux caractères SL È 


Risque de première espèce ; 


Méthodes de Bayes et de Neyman 


@ Concepts principaux en théorie des tests 


Dans le chapitre précédent, nous avons retenu un modèle statistique paramétrique 
pour décrire de façon simplifiée, mais théorique, un certain phénomène réel. Les va- 
leurs observées, liées à ce phénomène, sont alors considérées comme des réalisations 
d’une variable aléatoire dont la loi est inconnue, mais appartient à une famille donnée. 
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Cette loi est totalement spécifiée par la connaissance d’un nombre réel 8, appelé para- 
mètre, et qui permet de repérer précisément l’élément de cette famille de lois. La théorie 
de l’estimation fournit les outils permettant de se faire une idée de la valeur numérique 
de ce paramètre. 


Ici, la théorie des tests va être un outil d’aide à la décision. Dans le cadre du même 
modèle, on dispose cette fois de plus d’informations a priori sur le paramètre. Ces in- 
formations se traduisent par deux hypothèses seulement sur les valeurs possibles du 
paramètre. En fonction des observations, on devra choisir l’une de ces deux hypothèses. 
Nous allons montrer, à partir d’un exemple, comment on peut se fixer une règle de 
décision entre ces deux hypothèses. 


Le ministre de l'Économie et des Finances s'interroge pour savoir s’il doit prendre 
des mesures de relance de l’économie. Sa décision va être fondée sur les observations de 
l'accroissement mensuel de l’indice de la production industrielle. Cet accroissement est 
mesuré par l’Insee avec une certaine incertitude, ce qui amène à le considérer comme 
une v.a. Î de loi normale, de moyenne m, et d’écart type connu o = 0,2 %. Dans la 
période antérieure, le paramètre m avait pour valeur m = 0,5%. En période de récession, 
on considère que ce paramètre prend la valeur m = 0,3%. Pour faire un choix entre ces 
deux valeurs, le ministre attend de disposer des valeurs de 7 pour le dernier trimestre. 
Inquiet de l’effet de mesures de relance sur l'inflation, il se fixe a priori la règle de 
décision suivante : si la moyenne des accroissements du trimestre est inférieure à 0,35 % 
alors je prends des mesures de relance. On peut alors se poser les questions suivantes : 
est-il possible de mesurer les risques associés à cette règle arbitraire ? peut-on fixer à 
l’aide de critères objectifs un autre seuil que la valeur retenue de 0,35 % ? 


Le modèle statistique va nous permettre de répondre et d’associer des évaluations nu- 
mériques à cette règle de décision. La v. a. J appartient ici à la famille des lois normales, 
d’écart type connu © = 0,2. L'autre paramètre de cette loi, la moyenne m, est inconnu, 
mais ne peut prendre ici que deux valeurs. Il s’agit donc de faire un choix entre les deux 


hypothèses : 
H, : 12 N(0,3;0,2) 
H, : IR N(0,5;0,2) 


Chacune de ces hypothèses a pour conséquence une décision qui lui est associée : 


— D, : prendre des mesures de relance de l’économie ; 
— D, : ne rien faire. 
Cette décision va être prise au vu d’un échantillon (J;, L,, 1,) de cette v.a. I observée 


au cours du dernier trimestre. La règle de décision retenue par le ministre se formalise 


alors de la façon suivante : 
si (Li +L+1) <k on décide D, 


si (Li +L+1) >k on décide D, 


WI WI 
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La valeur de k, appelé seuil critique, est fixée arbitrairement ici à k = 0,35. 
Chacune de ces décisions a pour conséquence une erreur éventuelle : 

— relancer l’économie (D,) en période d'expansion (H) et favoriser ainsi l’inflation ; 
— ne rien faire (D,) en période de récession (H,,) et accroître le chômage. 


Le modèle statistique retenu permet alors de calculer les probabilités associées à ces 
deux erreurs. Par exemple : 


3 
a = P(nerienfaire|m = 0,3) = P (D 1145) = 102 A 


Sous l’hypothèse H,, la loi de 1 = L DE I; est la loi normale N ne 
3 j=1 J 43) 
On peut donc calculer la probabilité précédente en utilisant une va. U de loi 


N (0, 1): 


; Ï-0,3 0,05 
LS PITS OBS IA EP > V31H 
) (Et n) 


= P(U > 0,43) = 0,33 
De même, l’autre risque d’erreur se calcule par : 
B =  P(relancer|m = 0,5) = P(D,|H,) = P(I<k|H;) 
1-0, _015 


0, VAR Le 


Ces deux risques ne sont donc pas équivalents, le premier étant trois fois supérieur 
au second. Cette règle correspond donc bien à un souhait de se garantir avant tout contre 


P 


Vu) = P(U < —1,30) = 0,097 


l'inflation. Si on veut que le seuil ne soit pas fixé arbitrairement, c’est par le choix d’une 
valeur de risque que l’on en déduira alors une valeur de seuil critique. Si on souhaite 
plutôt se prémunir prioritairement contre le chômage, on fixe une valeur faible au risque 
æ, par exemple « = 5%. Il va en découler une valeur du seuil k par la condition : 


3 
mos=r(i Duran) =e{u> Êe it) 
ja 0,2/V3 


On obtient ainsi : 
RES. émo Le Eden 00-040 
0,2/V3 V3 


L'autre risque a alors pour valeur : 


0,49 — 0,5 


B=P(I<k|H)=P|U< 
ù ( 0,2/ V3 


) = P(U < —0,09) = 0, 4641 
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Le risque de relancer à tort est cette fois très élevé. Pour une décision où ce risque 
serait considéré comme le plus dommageable, il faudrait fixer le seuil k par la condition : 


k—0,5 


0,2/V3 


B = 0,05 = P(relancer|m = 0,5) = P| U < 


On obtient alors comme valeur : 
0,2 
3 


k=0,5 — 1,6449 = 0,31 


La règle de décision, déterminée par le seuil, est fortement dépendante du risque 
contre lequel on souhaite se prémunir en priorité. 


Cet exemple introductif va nous permettre de formaliser un problème général de test. 
On considère un modèle statistique où la loi de probabilité P, de la v.a. X dépend d’un 
paramètre inconnu Ô qui varie dans un sous-ensemble donné © de R. On suppose que cet 
ensemble est partitionné en deux sous-ensembles donnés ®, et O,, auxquels vont être 
associées les deux hypothèses notées A, : 0 € 6, et H, : 0 E @,. Construire un test 
consiste à définir une règle de décision qui va associer une décision à un échantillon 
observé (X,,...,X,) de la loi de X, les deux décisions possibles étant D, : accepter 
H,, et D, : accepter H. À chaque décision correspond une région de R” , qui va donc 
être partitionné en deux sous-ensembles W et W, c’est-à-dire que si la réalisation de 
lPéchantillon est un point (x,,...,x,) de W on décide D,, donc on rejette H,. Dans le 
cas contraire, c’est-à-dire pour un point de W, on décide D,, donc on accepte H,. 


DÉFINITION 


La région W de rejet de l'hypothèse nulle HÇ se nomme région critique du test et 
la région W région d'acceptation. 


La construction d’un test va donc consister à déterminer cette région critique. La 
méthode pour l’obtenir dépendra des conséquences que l’on attribue à chacune des deux 
erreurs qui sont associées aux deux décisions possibles. Ces erreurs sont les suivantes. 


DÉFINITION 


L'erreur de première espèce consiste à décider D, alors que H, est vraie, soit 
rejeter à tort l'hypothèse nulle H,. L'erreur de seconde espèce consiste à décider 
D, alors que H; est vraie, soit accepter à tort l'hypothèse nulle Hi. 


Nous allons présenter deux méthodes de construction d’un test, basées sur des prin- 
cipes très différents. La méthode de Bayes est utilisée lorsqu'on dispose encore plus 
d'informations a priori sur les hypothèses, permettant de leur attribuer une probabilité 
a priori, et lorsque l’on peut en plus quantifier le coût de chaque décision en fonction 
de l’hypothèse effectivement réalisée. 
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(à) Méthode de Bayes 


On se place dans le cas où on a attribué des probabilités a priori ps et p, = 1 — po à 
chacune des hypothèses respectives H, et H, et que l’on a également associé un coût 
à chaque décision, en fonction de l’hypothèse qui est effectivement réalisée. Le tableau 
ci-après contient ces coûts, la décision prise figurant en colonne et l’hypothèse vraie en 
ligne : 


Ho) | Coo Co 


H;i(p1) | Co Ci 


Une bonne décision peut avoir également un coût et donc on aura généralement 
Co > Det C,, > 0. 

Après la réalisation (x,,...,x,) on peut calculer, à l’aide du théorème de Bayes, les 
probabilités a posteriori x, et x, des hypothèses H,, et H, : 


PoLo PiL: 


T0 — = 
PoLo + PiL; 


PoLo + Pi 
où on a noté L,, la valeur de la vraisemblance L (x;,...,x,; 0), quand 0 E O,,, et L,, 
quand 8 € ®,. On peut alors calculer les espérances du coût de chaque décision pour 
cette distribution a posteriori : 


E[C(D5)] = CopZo + Com et E [C (D;)] = Co%o + Cu 


La règle de décision de Bayes consiste à associer à l’observation (x,,...,x,) la 
décision dont l’espérance de coût est la plus faible. 


Exemple 8.1 

Nous allons reprendre l’exemple introductif en supposant cette fois que les informa- 
tions disponibles permettent d’attribuer la probabilité p, = 0,6 à l'hypothèse d’entrée 
dans une période de récession, qui se traduit par m = 0,3. On considère de plus qu’une 
bonne décision est sans coût, soit Cip = Cj, = 0, et que le coût de relance à tort est 
trois fois plus élevé que celui de ne rien faire en période de récession, soit C9 = 3Co 
Dans ces conditions, les espérances du coût de chaque décision sont : 


E[C(Di)l = Cioi = 3Cum et E[C(D;)] = Cu 
On a donc : 
E[C(D;)] <E[C(2,)] = 3x <% 
Pi L 


ss 3p.L, <pl 3 <122< © 
Pi < Polo Po L Fa 
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L'expression de la vraisemblance est ici : 


L (x1,2%2, x35m) — ( 


Le rapport des vraisemblances est donc : 


3 
Deep D [(u-m0) (x -m)] 
La décision D, a donc le coût le plus faible si : 
I? < 7 Lu Lx mo) — (x m)°] 
In? < [25 x 3 (mo + mi) 


3 3 
}av-h 2m 


oV2x 


La règle de Bayes donc à choisir la décision D, dans le cas où : 


In2 < 6— DÉREE D < 275 = 0,353 


On retrouve la même règle de décision avec le même seuil critique arrondi qui avait 
été fixé à la valeur k = 0,35. 


Méthode de Neyman et Pearson 


3.1 Principe de la règle de Neyman et Pearson 


On privilégie l’une des deux hypothèses, par exemple celle que l’on considère comme 
la plus vraisemblable, et on la choisit comme hypothèse nulle H,. Cette hypothèse sera 
celle dont le rejet à tort est le plus préjudiciable. L'autre hypothèse A, est l’hypothèse 
alternative. Il n’y a donc pas de symétrie entre ces deux hypothèses. L'hypothèse H, 
est privilégiée et il faut des observations très éloignées de cette hypothèse pour la rejeter. 


DÉFINITION 


On appelle risque de première espèce la probabilité de rejeter à tort l'hypothèse 
nulle, soit : 


= P, (DilHo) = Po (Hilo) = PyWI8 € @5) 


On appelle risque de seconde espèce la probabilité d'accepter à tort l'hypothèse 
nulle, soit : 


B = P(DolH1) = PoHolH1) = Ps (wie e e1) 
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L'erreur la plus grave consistant à rejeter à tort l’hypothèse nulle, la méthode de 
Neyman et Pearson fixe une valeur maximum &, au risque de première espèce. Le test 
est alors déterminé par la recherche de la règle qui minimise l’autre risque, celui de 
seconde espèce. 


DÉFINITION 


On appelle puissance d'un test la probabilité de refuser Ho avec raison, c'est-à-dire 
lorsque H; est vérifiée, soit : 


n = PolDilHi) = P(HilH) = P,(WI8 € @:) = 1-8 


La règle de décision de Neyman et Pearson consiste à déterminer la région critique 
W pour laquelle la puissance est maximum, sous la contrainte « < a,. Le choix de la 
valeur de «, peut être déterminant quant à la conclusion tirée au vu d’un échantillon. 
La valeur standard retenue est a, = 0,05. Choisir une valeur plus faible (par exemple 
&p = 0,01) conduit à exiger des contre-preuves très fortes pour rejeter H,, qui est ainsi 
admise a priori. Choisir une valeur plus forte (par exemple a, = 0,10) signifie que l’on 
est moins convaincu a priori de la validité de H, et que l’on est prêt plus facilement à 
la rejeter au vu des observations. 


3.2 Hypothèses simples 


Une hypothèse est qualifiée de simple si la loi de la v.a. X est totalement spécifiée 
quand cette hypothèse est réalisée. Dans le cas contraire elle est dite multiple. Nous 
allons examiner le cas où le paramètre @ ne peut prendre que deux valeurs 6, et @,, ce 
qui correspond au choix entre les deux hypothèses simples suivantes : 


H,:0=6, 


Même si cette situation est peu fréquente dans la réalité, de nombreux autres cas 


peuvent être résolus à partir de ce cas élémentaire. La forme de la région critique est 
alors déterminée par le théorème suivant. 


Théorème 3.1 RRecErcereer senc eee sers eenre sers eee sense eee eee eee STE : 


Théorème de Neyman et Pearson 


Pour un risque de première espèce fixé à @,,, le test de puissance maximum entre les 
: hypothèses simples ci-dessus est défini par la région critique : 
Lo (x, . ) 


W = pee Xn) —————< <wk 
Gi : NS Er x,) 


; où la valeur de la constante k est déterminée par le risque fixé aÿ = P,(W10 = 65), 
| ayant posé Li(x,, …, x,) = L(x,,..,x,; 00) et Li(x,,..,x,) = L(x,,..,x,:0;). 
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Exemple 8.2 


: JR à S Send 
Nous allons appliquer ce théorème au cas de la loi exponentielle de paramètre 3 avec 
0, > 6,. La vraisemblance a pour expression : 


1 1 + 
Lire) Rep |E > 
avec x, > 0,1 < i < n. Le rapport des vraisemblances est donc : 


Lo ii4%) - (R) 


L, (x, 0) CA 


La région critique est donc définie par la condition : 


GC} n 1 1 n 
2 se ARE 
GG) ET] 


Cette condition est équivalente à : 


Puisque #, > 6, , on arrive à la condition : 


n 
Du>c 
i=1] 


La valeur de la constante C, qui va totalement préciser la région critique, est 
déterminée par la condition : 


Dans l’exercice 7.7 nous avons établi que 2,5,/8 suivait une loi du khi-deux à 2n 
degrés de liberté, avec S, = Y_, X;. La condition précédente se réécrit donc sous 


la forme : 
S 
a =P42— > 2€ 


La valeur de 2€ est donc celle du fractile d’ordre 1 — «, de la loi du khi-deux à 2n 


0 
degrés de liberté. La puissance de ce test peut ensuite se calculer par : 


n S C 
=PAVX,>cl0=0, :=PlI">2€ 
: D a | (> mL 
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3.3 Hypothèses multiples 


Nous allons d’abord considérer le cas d’une hypothèse simple contre une hypothèse 
multiple de l’une des formes suivantes : 


H,:0>06 H,:0<6, 


On détermine au préalable, par la méthode de Neyman et Pearson, la région cri- 
tique W du test suivant : 


H, :0=0 
H,:0=06, 


où 0, est une valeur fixée quelconque, mais vérifiant l’hypothèse alternative H,. Si la 
région W obtenue pour ce test entre hypothèses simples ne dépend pas de la valeur 
choisie 0,, alors on aura obtenu un test uniformément le plus puissant (U PP) pour 
le problème de test initial. Cela signifie que pour toute autre région critique W on aura 
P,(W10 e 6,) > P,(W'|0 € ®,) pour tout 9 de @.. 


Exemple 8.3 


Si nous reprenons l’exemple 8.2, la région critique dépendait de la condition 8, > @,, 
mais pas de la valeur précise 4,. La région critique obtenue est donc aussi celle du 
test U PP de H, : 8 = 6, contre H, : 8 > @,. Cependant, on ne peut pas cette 
fois calculer la puissance de ce test puisque la valeur du paramètre n’est pas connue 
dans l’hypothèse alternative. On peut seulement définir une fonction puissance de ce 
paramètre par : 


w=r{Sxzcu>t) 
i=1 


Pour le problème de test suivant : 
{ H,:0=06 
H,:0#0, 
il n’existe pas de test U PP. La région critique W de ce test s’obtient par réunion 
des régions critiques W, et W,; des deux tests précédents, pour le même risque de 


Fe . % 
première espèce a: 


Exemple 8.4 
Dans l’exemple précédent, la région critique W, obtenue était l’ensemble des points 
(x, …, X,) tels que : 


S,ZzC; 
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C 
avec 2 qui est le fractile d’ordre 1 — _. de la loi du khi-deux à 2n degrés de liberté. 


0 
De même, pour le test de H, : 8 = 6, contre H, : @ < 6, la région critique W, 
obtenue est définie par : 


de 


C 

avec 2e qui est le fractile d’ordre . de la loi du khi-deux à 2n degrés de liberté. 
0 

La région critique de H, : 8 = 8, contre H, : 8 £ 8,est W = W UW, . Il est plus 


facile de définir ici la région d’acceptation de l’hypothèse nulle par la condition : 


G<S,<C 


Pour le problème de test suivant : 
{ HE È<0 
H,:0>6 

on suppose que la loi P, est à rapport des vraisemblances monotone. Cela signifie qu’il 
existe une statistique T,, = T,(x,,.…., x,) telle que le rapport des vraisemblances : 

L (is 3 X55 0) 

EC 07) 
s'exprime comme une fonction croissante de T,, pour toutes les valeurs de 8 et 9’ qui 
vérifient l’inégalité 0 > 0'. Dans ces conditions, on utilise le théorème suivant. 


Théorème 8.2 HRerEErereErenc Eernrereer ee ee EE ES u 
É Théorème de Lehmann Ë 
Il existe un un test UPP dont la région critique W est l’ensemble des points E 
Ë (x, x,) tels que : 

TX, Xx,) > k 
: où la valeur de la constante k est déterminée par le risque fixé a, = P,(W10 = 6,). : 


Exemple 8.5 


Dans l’exemple 8.2, nous avons obtenu comme rapport des vraisemblances : 
L (x ,X 


#50) "A g=0 À 
Essen) nu (5) | 00! >| 


i=1 


Pour toutes les valeurs de @ et 9’ qui vérifient l'inégalité 9 > 8’, c’est une fonction 
croissante de T, = }°_, x;. Donc, par application du théorème de Lehmann pour 


H, : 0 < 0, contre H, : 0 > 6,, le test U P P à pour région critique l’ensemble des 
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points (x,,.., x,) tels que : 
n 
7» x; > k 
i=1 
La constante k est déterminée par la condition : 


d=P4 D X;>Kkl60=6 
i=]l 


@ Test d'indépendance du khi-deux 


Pour tester l’indépendance de deux caractères X et Y, qualitatifs ou quantitatifs (répartis 
alors en classes), à respectivement r et s modalités, on relève le nombre n; j d'individus 
d’une population de taille n = }}_, 2 n;; qui possèdent simultanément la modalité 
i, 1 < i < r, du caractère X et la modalité j, 1 < j < s, du caratère Y. Soit Di la 
probabilité théorique correspondante, pour un individu tiré au hasard dans la population, 
de posséder simultanément ces deux modalités i et j. Les probabilités marginales sont 


= = Pi tp; = Xi Pi; L'indépendance de ces deux caractères se traduit par 


l'hypothèse nulle H, : p;; = p;. X p;. Pour tester cette hypothèse contre l’alternative 
1° Pi À P; XP. On utilise la statistique : 


n; nn/n) 
EDDE — LODEE 
i J L J 


Sa loi asymptotique, sous AH, est la loi du khi-deux à (7 — 1) (s — 1) degrés de liberté. 


2 S Fr . . 
Onanotén, =}; n;etn, = »;_,n,,les effectifs marginaux. 


La région critique de ce test est de la forme : 


D,>C 


n 
Pour un risque de première espèce « = P(D, > C|H,), la valeur de C est approximée 
—1)(s-1) 


Exemple 8.6 


Pour comparer l’efficacité de deux médicaments semblables, mais de prix très diffé- 
rents, la Sécurité sociale a effectué une enquête sur les guérisons obtenues avec ces 
deux traitements. Les résultats sont présentés dans le tableau suivant : 


Médicament cher | Médicament bon marché 


Guérisons 156 44 200 
Non-guérisons 44 6 50 
200 50 250 
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On calcule la valeur de la statistique : 


Es +24 + ds _ 1) — 2,9 

4.104 104 25.102 

Pour un risque de première espèce & = 0,05 le fractile d’ordre 1 — « de la loi # 
a pour valeur C = 3,84. Puisque la valeur observée de la statistique D, est infé- 
rieure, on accepte l’hypothèse nulle d'indépendance du taux de guérison et du coût 


du médicament. 


D, = 250 ( 


© Compléments 


Construire un test consiste à établir une règle de décision, c’est-à-dire une applica- 
tion p de R” dans {0,1}. Pour toute réalisation (x,,...,x,) de l’échantillon telle que 
px, …, x,) = 1 on rejette l’hypothèse H. Pour toute réalisation (x, .…., x,) de l’échan- 
tillon telle que p (x Te à) = 0 on accepte l'hypothèse H,. La fonction de test p est 
donc la fonction indicatrice de la région critique W : = 1,,. Pour un test entre deux 
hypothèses simples H,, : 0 = @, contre H, : 8 = 6,, le risque de première espèce est 
a=E, [b (X;, X,)| et la puissance 7 = E, [b (X,, 4%) h 

Quand p est à valeurs dans {0,1 } le test est dit pur ou déterministe. Dans le cas d’une 
loi discrète il n’est pas toujours possible de trouver une région critique W de probabilité 
exacte a. Dans ce cas, si on souhaite que le risque de première espèce soit exactement 
égal à «, il faut utiliser un test mixte. La fonction @ est cette fois à valeurs dans [0,1] et 
on accepte toujours H, pour D = 1 et H, pour = 0. Pour p = p € ]0, 1[ on effectue 
un tirage au sort où on accepte l’hypothèse H; avec une probabilité p. 

En présence d’hypothèses multiples H, : 0 € 6, contre H, : 0 € O,, le risque de 
première espèce est une fonction de 8 définie par « = E,(@) pour 8 € 6, . On définit 
alors la taille + du test par : 


r = sup Eÿ(#) 
ECN 


Le test est dit de niveau @ si r < a. La puissance du test est la fonction de 8 définie 
par n = E,y() pour 0 € 6, . Le graphe de la fonction définie pour tout 8 de @ par 
(8) = 1—E,(p) s’appelle courbe d’efficacité. 

Un test D de niveau a est dit uniformément plus puissant qu’un autre test D’ de 
même niveau a si, pour tout 0 € ®, on a E, (D) > E,(®'). 

Un test de niveau « est dit sans biais si, pour tout 0 € @,, on a E,(@) > a. 


2. 92 


La famille exponentielle à un paramètre dont la densité s’écrit sous la forme : 
FC; 0) = a(8)b (x) expla(8)T (x)] 
est à rapport des vraisemblances monotone si la fonction « est une fonction monotone 


du paramètre 8. Si « est croissante, on retient la statistique T, = }7_, T(x;), et si « est 
décroissante, on retient la statistique T, = — X”_, T(x;). 
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En dehors du cas particulier où on se donne une loi de probabilité a priori : 
sur les valeurs du paramètre et où on utilise la méthode de Bayes, c'est la 
méthode de Neyman et Pearson qui est utlisée pour effectuer un test d'hy- 
pothèses. Le théorème de Neyman et Pearson fournit l'outil essentiel pour bâtir 
un test, c'est-à-dire définir la région où on va rejeter l'hypothèse nulle retenue. 
Il est bien entendu essentiel de connaître les définitions précises des différents 
concepts intervenant dans les tests statistiques. Notons que les deux hypothèses 
à confronter ne sont pas équivalentes et que l'hypothèse nulle est privilégiée, 
étant choisie comme celle dont le rejet à tort est le plus préjudiciable. Notons 
enfin l'importance du choix de la valeur du risque de première espèce, dont 
peut dépendre la conclusion tirée d'un échantillon donné. 
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8.1 


8.2 


8.3 


8.4 


8.5 


Une machine produit des pièces dont une proportion 8 présente des défauts qui condui- 
sent à classer ces pièces en second choix. En cas de bon fonctionnement la valeur est 
8 = 0, 1. Si la machine se dérègle, la valeur passe à 0 = 0,2. On estime que la probabilité 
que la machine soit bien réglée est p, = 0,6. On peut souscrire un contrat d’entretien 
qui permet de maintenir la machine bien réglée. Le coût est de 0,4 euros par pièce 
produite. Chaque pièce de second choix est vendue 6 euros de moins que les autres. 
Après contrôle des 100 premières pièces produites, on constate que 13 d’entre elles 
doivent être classées en second choix. Quelle décision est-on conduit à prendre si on 
utilise la méthode de Bayes ? 


On dispose d’un échantillon (X,,..., X,) d’une v.a. X qui suit une loi normale d’espé- 
rance inconnue m et d’écart type connu © = 1 pour choisir entre les deux hypothèses : 


H 1 : m= 1, 5 
Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance 


dans le cas où ñn = 25 et à = 0,05. Quelle devrait être la taille d’échantillon minimum 
pour que cette puissance soit supérieure à 0,90 ? 


On dispose d’un échantillon (X,,..., X,) d’une v.a. X qui suit une loi normale centrée, 
d'écart type inconnu o pour choisir entre les deux hypothèses : 


H, :o=l 
H 1 :6=2 
Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance 


dans le cas où n = 15 et « = 0,05. 


Le revenu annuel des individus d’une population est distribué selon une loi de Pareto 
de densité : 


0 - 
f(x:0) = nr Six> 1] 


0 sinon 


On dispose d’un échantillon (X,,..., X,) de cette loi pour choisir entre les deux 
hypothèses : 


Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance 
dans le cas où n = 400 et « = 0,05. 


Soit X une variable aléatoire dont la densité a pour expression, pour x > 1: 


et nulle sinon, où 8 et À sont deux paramètres strictement positifs. 
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1. Déterminer l’estimateur À du paramètre À par la méthode du maximum de vraisem- 
blance construit à partir d’un échantillon (X,,..., X,) de X et étudier ses propriétés. 


2. Déterminer l’estimateur à, du paramètre @ par la méthode du maximum de vraisem- 
blance et étudier ses propriétés. Déterminer sa loi asymptotique. 


3. Déterminer la région critique du test : 
H 1 : À _ À 
pour un risque de première espèce donné «, sachant que À, > 49. Déterminer le risque 
de seconde espèce f et la puissance #. 
4. Déterminer la région critique du test : 
H 1 : 0 —= ô; 


pour un risque de première espèce donné a, sachant que #, > 6,4. Pour déterminer 
approximativement le seuil critique de ce test on utilisera l’estimateur À, et la loi 
asymptotique de Ô,. Calculer de la même façon une valeur approchée de la puissance 
de ce test. 


5. Déterminer la région critique du test : 
H, :0#0 
Ce test est-il UPP ? Peut-on calculer sa puissance ? 
6. Déterminer la région critique du test : 
H,:0<0 
H,:0>0 


Appliquer le théorème de Lehmann pour établir que ce test est UPP de niveau a. Mon- 
trer que le risque de première espèce « est une fonction croissante de 0 qui est maximum 
pour 0 = 65. 


On dispose d’un échantillon de taille n = 15 d’une v.a. de loi normale centrée et de 


: 1 3 É 
variance n pour choisir entre les deux hypothèses : 


H,:0=1 
H,:0>1 
Déterminer la région critique d’un test UPP de risque de première espèce « et préciser 


sa fonction puissance. Calculer cette puissance dans le cas où n = 15, pour 0 = 3 et 
a = 0,05. 


Le poids indiqué par une balance, lorsqu'on effectue la pesée d’un poids étalonné à 
100 g, est une v.a. de loi normale d’espérance 100. Si la balance est bien réglée, l’écart 
type a pour valeur « = 5 et sinon cette valeur est inconnue, avec & > 5. Déterminer 
la région critique d’un test UPP de risque de première espèce «a = 0,05 basé sur un 
échantillon de n = 10 pesées et préciser sa fonction puissance. 
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8.9 


8.10 


8.11 


8.12 


8.13 
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Le nombre de pannes mensuelles d’un ascenceur est une v.a. qui suit une loi de Poisson 
de paramètre À = 2. Après avoir souscrit un contrat d’entretien, on pense que la valeur 
du paramètre doit diminuer. Préciser la règle de décision à l’issue de six mois de contrat. 


On dispose d’un échantillon (X,,..., X,) d’une v.a. X qui suit une loi normale d’espé- 
rance inconnue m et d’écart type connu © = 1 pour choisir entre les deux hypothèses : 


H,:m<3 
H,:m>3 


Déterminer la région critique du test le plus puissant de niveau & = 0,05 dans le cas où 
n = 100 et préciser sa fonction puissance. 


On dispose d’un échantillon de taille n = 12 d’une va. X qui suit une loi nor- 
male d’espérance inconnue m et d’écart type inconnu © pour choisir entre les deux 
hypothèses : 


H,:m<6 
H,:m>6 


Déterminer la région critique d’un test de niveau &« = 0,05. Peut-on déterminer sa 
fonction puissance ? 


La durée de vie d’un certain matériel est une v.a. X qui suit une loi de Weibull de 
densité : 


1 AR 
2 0 
f 0) = ne? ( ;) ni 
0 


sinon 


On dispose d’un échantillon (X,,.., X,) de cette loi pour choisir entre les deux 
hypothèses : 


H,:0<1 
H,:0>1 


Déterminer la région critique du test le plus puissant de niveau & = 0,01 dans le cas où 
n = 15 et préciser sa fonction puissance. 


Pour sa fabrication, un industriel utilise des machines de deux constructeurs différents. 
Après six mois d'utilisation, il constate que sur les 80 machines de type A, 50 ne sont 
jamais tombées en panne, alors que pour le type B la proportion est de 40 sur 60. 
Peut-on considérer que ces deux types de machines sont équivalents ? 


Deux séries d’observations effectuées à des dates différentes, sur des échantillons 
de tailles respectives n; = 41 et n;, = 61, ont conduit à des valeurs respec- 
tives de moyennes empiriques et d’écarts types empiriques x = 785,5, = 1,68, 
y = 788ets, = 1,40. Peut-on considérer que ces deux échantillons proviennent de 
la même loi normale ? 
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8.14 Le tableau ci-après donne la répartition par taille, en cm, de 2700 salariés français, de 
sexe masculin, par catégories socio-professionnelles (CSP) : 


Ouvriers | Employés | Cadres | Total 
Moins de 165 cm 325 66 22 413 
De 165 à moins de 170 cm 488 110 51 649 
De 170 à moins de 175 cm 636 158 123 917 
175 cm et plus 451 146 124 721 
Total 1900 480 320 2700 


Au vu de ce tableau, peut-on considérer que la taille est indépendante de la CSP ? 
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8.1 Nous allons formaliser le problème en construisant le modèle statistique. Nous allons 
introduire une variable indicatrice qui prend la valeur 1 si la pièce produite est de second 
choix. C’est une variable de Bernoulli définie par : 


{ 1 sisecond choix (4) 

X = à 

O sinon (1-0) 

Nous sommes en présence de deux hypothèses, H, : 0 = 0, 1 avec une probabilité a 
priori pp = 0,6 et H, : 8 = 0,2 avec une probabilité p, = 1 — p5 = 0,4. Nous devons 
choisir entre la décision D, de ne pas souscrire le contrat d’entretien et la décision D; 
de le souscrire. Le coût moyen par pièce produite associé à la décision D, est de 66, qui 
correspond au manque à gagner, car 0 représente la valeur moyenne de X. Si on prend 
la décision D, de souscrire le contrat d’entretien, le coût est de 0,4 par pièce, plus le 
manque à gagner de 6 X 0, 1 puisque la proportion de second choix est alors toujours de 
10 %. Tout ceci est résumé dans le tableau de coûts suivant : 


D, | D, | Probabilité a priori 


Ho :0=0,1 | 06 | 1 0,6 


H1:0=02|12| 1 0,4 


La vraisemblance de l’échantillon (X,,..., X,) de cette loi de Bernoulli s’écrit : 


dt eo ce 


avec x; € {0,1}, 1 < i < n. On note L, la vraisemblance pour 8 = 0,1 et L; pour 
0 = 0,2. Les espérances a posteriori des coûts sont : 


E[C(Do)] =0,6x0+ 1,27, et E[C(D;)|=x0+7=1 
La règle de Bayes conduit à souscrire le contrat si E[C(D,)] > E[C(D,)] soit : 


0,670 + 1,2x, > 1 => 0,36L0 + 0,48L, > 0,6Lo+0,4L, 
= 8L, >24L 


# In3 — nin= 
= ÿ x> 5 
i=1 n7 


Pour un échantillon de taille n = 100, on décide de souscrire le contrat d’entretien si 
>. x; > 15,9 soit, puisque les x; ne prennent que des valeurs entières, >" x; > 16. 


Ayant observé »" x; = 13, la règle de Bayes conduit à ne pas souscrire le contrat 
d'entretien. 


8.2 La vraisemblance s’écrit : 


L (Kris X,5m) = () exp {+ > (x; -n } 
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Tests d'hypothèses 


La forme de la région critique, donnée par le théorème de Neyman et Pearson, est 
Lo/L, < k, ce qui en passant aux logarithmes conduit à l’inégalité : 


n 
2 Xl)? - (x 15) < me 
i=1 
Elle est équivalente, après développement du crochet, à : 
nn 5 
= Yx;+ 2 <21nk 
i=1 à 


Pour l'instant, on cherche seulement à déterminer la forme de la région critique et 
l’expression des constantes qui apparaissent dans cette inégalité est sans intérêt. On 
remplace donc cette inégalité par D x; 2 k;, qui lui est équivalente. La région cri- 
tique est donc définie à partir de la valeur de la somme des observations. Cependant, 
comme c’est la loi de la moyenne empirique +. qui est connue, il est préférable de 
faire intervenir cette moyenne dans la définition de la région critique W, qui sera donc 
l’ensemble des points (x,,.….,x,) tels que : 


x,>C 


Il reste à préciser la valeur de cette constante C, qui sera le seuil de cette région, à 
partir du risque de première espèce « qui est fixé. Il représente la probabilité de cette 
région, lorsque l’hypothèse nulle est réalisée, et par conséquent, la condition qui définit 
C s’écrit : 


a=P(Wim=1)=P(X,>CIm=1) 


Sous H,, la moyenne empirique X, suit la loi N(1,1/ 4/1) , donc en centrant et rédui- 


sant on obtient la condition : 
a=P|U> Es 
1//n 


où U est une v.a. de loi N(0, 1). Ainsi la constante C est définie par : 


C=1+— 
Vn 
où u est le fractile d’ordre 1—a de la loi N(0, 1). Pour un risque a = 0,05 on lit dans la 
table 2 le fractile u = 1,6449 d’où une région critique définie pour n = 25 par : 


W = es %5) 1x5 > 1,33} 


Dans ce cas, la puissance du test est la probabilité de cette région dans l’hypothèse 
alternative, soit : 


. 1,33 -1,5 


n= P(X3s > 1,33 |m = 15) (> Le) = P(U > —0,85) = 0, 8023 
1/V25 
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8.3 


8.4 


Pour un risque « = 0,05 la condition 7 > 0,90 conduit à choisir une taille d’échantillon 
n telle que : 


— n 
nr(reitmers)-r(use-)zas 


n 
ce qui est équivalent 1, 6449 — V/n/2 < —1,2816 soit Vn > 5,853 donc une taille 
d’échantillon supérieure à n9 = 35. 


Pour effectuer ce test, nous disposons d’un échantillon d’une loi normale centrée, 
d'écart type o = 1 sous H, et o = 2 sous H,. Le rapport des vraisemblances a donc 
pour expression : 


És 1 n 1 n 3 n 
= 2exp[ = Des Dax ]=2ep 2 x 
: on! 5 2 x; exp s2 x; 


i=1 = 


La région critique est donc définie par le théorème de Neyman et Pearson comme 
l’ensemble des points (x, ,x,) tels que : 


n 
De>c 
i=1 


La valeur de la constante C est déterminée par la condition : 


n 
=r(Sa>cm) 
i=1 


Sous l’hypothèse nulle H,, D 4 X : suit la loi 2 donc C est le fractile d’ordre 1—-a 
de cette loi. Pour & = 0,05 on lit dans la table 5 la valeur € = 25. La puissance du test 
est : 


n 
nr(Sx>eu) 
i=1 


47. : 
Sous l’hypothèse H,, X}_, suit la loi 77, donc : 


n 
nr(iÿx> e) = 0,975 
i=1 4 


par lecture de la table 5. Notons qu'ici le risque de seconde espèce B = 0,025 est infé- 
rieur au risque de première espèce & = 0,05. Pour respecter la logique de Neyman et 
Pearson, il faudrait donc choisir un risque de première espèce plus faible. 


L'expression de la vraisemblance est : 


n n == 1 
L (x1, . Xy5 C)) = El pr = 9" (1 s) 
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Tests d'hypothèses 


Le rapport des vraisemblances, L, sous H,, et L; sous H;, s’écrit donc : 


0,-0 
(ee) (Ts) 
Li d i=1 


Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 


définit la région critique par la condition Le < k, qui est donc ici équivalente, en pre- 
1 


nant les logarithmes, à : 


n 
(CA = 60) 2 Inx; < k; 
i=]l 


Puisque 9, > 6,, cette région critique W est définie par la condition : 


n 
Dinx, <C 
i=1 


La valeur du seuil C est déterminée par : 


n 
a= PGI) = r (SX < ci -4) 
i=1l 


La taille d’échantillon permet ici d’utiliser le théorème central limite que nous allons 
appliquer à Y, = - ve Y, ayant posé Y; = InX,;,1 < i < n. Il nous faut pour cela 
déterminer la loi de la v.a. Y = InX. Sa fonction de répartition est définie par : 
G()=P(Y <y)=P(InX < y)= P(X <e’)=F(e) 
pour y > 0. On obtient la densité par dérivation : 
g(») = ef (e”) = 8e? 
On reconnaît la loi exponentielle de paramètre 9, donc E (Y) = : et V (Y) = œ- 
D’après le théorème central limite : 
Y,-—1/0 
—— — N(0,1 
Vi 105 D 


La constante C est alors déterminée approximativement par : 


ae r(F<S)=r{V(0, 1) <Vi(nE 1) 


n 
Le fractile d’ordre 0,05 de la loi N (0,1) a pour valeur — 1,645 donc la valeur approchée 
du seuil C est définie par la condition : 


Vi (ie -1) = 1,645 


Soit, pour n = 400, C = 275. La puissance est déterminée par : 


n 
n=P(W|H;) -r(Snx <ci = :) PTS =) 
i=]l 


AO E CE) 
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Sa valeur approchée est définie par n = ®(2,02)= 0,98, où ® est la fr. de la loi N(0, 1). 
Notons que le risque de seconde espèce f = 0,02 est inférieur au risque de première 
espèce & = 0,05. 


1. La vraisemblance est : 


n 
Era) me exp (- D s) ete 
i=1 
à condition que tous les x; soient supérieurs à À, ce qui est équivalent à la condition 
m, = min {x1, De i > À. La vraisemblance est une fonction croissante de À avant m, 
et nulle au-delà, donc atteint son maximum pour À = m,. L’estimateur du maximum 
de vraisemblance est donc : 


À,=m,= min {X1, _. 
my—À 


Q 


On peut établir que la va. Z =n 
On en déduit : 


suit une loi exponentielle, avec E(Z) = V(Z)=1. 


: _ 3,8 02 
(m,) = Le et V(m,) = _ 


C’est donc un estimateur asymptotiquement sans biais et convergent. 
2. La log-vraisemblance a pour expression : 
1 n 
n£L(x,,..,x,;0,À) = -n In0 — - X; — À 
( 1 n ) 0 2 ( i ) 
Cette fonction est dérivable pour tout 0 > 0 avec : 
1 n 
+— (x; — À) 


2 
=} 


OMmL _ _n 
90 0 


0 
La dérivée s’annule pour 4 = X7_, (x; — À) /n: la dérivée seconde est négative pour 
cette valeur : 
dInL_n 2 
00? Œ PE 


L’estimateur du maximum de vraisemblance est donc : 
n 
à 1 R 
0, = etat 
i= 
Cet estimateur est asymptotiquement sans biais : 
E(Ô,)=E(X)-E(m,)=0- - 
résultat déduit de la loi de m,. 
D’après la loi des grands nombres, X, converge vers E(X). Nous pouvons établir que 


m, converge vers À, donc 4, converge vers 0 + À — À = 6. 
D’après ce qui précède : 


Efvi(m- 2] & e v[Vi(m-2]- € 


0 
— € 
= 
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Tests d'hypothèses 


Ces deux moments tendent vers 0 avec 1/n donc : 
Va (m, — 2) mé 0 
Nous pouvons écrire : 
Vn(6,-0) = Vn(X,-0-2)- Vi (m, - 2) 
Le théorème central-limite et le résultat précédent nous permettent de conclure : 
Va (8, —6)— N (0.8) 


3. La région critique de ce test est construite à partir de l’estimateur du maximum de 
vraisemblance de 4. Comme À, > 2, elle est définie comme l’ensemble des points 
(x1,…, x, ) tels que m, > C. La constante C étant définie par : 
C- 

0 
soit C = À) — (8 In «)/n. Le risque de seconde espèce est : 


C-1, 20 — À 
= |—-aexp -n F 


a=P(m,>C|Ho)=exp -n 


B=P(m,<C|H;)=1-exp -n 
La puissance s’en déduit par n = 1—. 
4. On utilise le théorème de Neyman et Pearson et on forme le rapport des vraisem- 
blances : 


OR ENTRE DIE) 


i=1 L'i=] 


Comme 0; > @,, ceci est équivalent à : 
n 
Di-2)># 
i=l 
La valeur de À étant inconnue, on doit utiliser une approximation en remplaçant ce 
paramètre par son estimateur : 


A 


0,=x,-m,>C 


La constante C étant définie approximativement par : 


a=P(ô,>C|Ho) "(ee > x) 


On retient donc comme valeur approchée du seuil : 


C1) 
Cetaus 
n 
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où u est le fractile d’ordre 1 — a de la loi N(0, 1). 
La puissance se calcule alors par : 


2 ü —-0 C8 
= rê> eue (VA Len à ) 
1 L 


en utilisant à nouveau la loi asymptotique N(0, 1). 


5. La région critique précédente dépendait des valeurs respectives de 8 dans les deux 
hypothèses. Le test de région d’acceptation définie par : 


Cré0ec 


n’est donc pas UPP. Les valeurs approchées des seuils critiques sont : 


où u est le fractile d’ordre 1 —-a/2 de la loi N(0, 1). On ne peut pas calculer la puissance 
de ce test, l’hypothèse alternative étant multiple. 

6. Pour 0! > 8 le rapport des vraisemblances Lyy/ L, est une fonction croissante de ô. 
D’après le théorème de Lehmann, la région critique du test de la question 4 est celle 
d’un test UPP pour les hypothèses confrontées ici. Son risque de première espèce est 
défini par : 


a(0) = P(Ô, > ci P(1rèE > 2) 


Cette fonction atteint son maximum, d’après le théorème de Lehmann, pour 0 = 6. 
Si on utilise la loi asymptotique, le seuil V/n(C /0 — 1) est une fonction décroissante 
de 6, donc « est bien une fonction croissante de 6. 


L'hypothèse alternative étant une hypothèse multiple, on détermine d’abord la région 
critique du test entre les deux hypothèses simples : 


H,:0=1 
H, :0=06, 


avec 0, quelconque, mais vérifiant 0, > 1. L’ expression de la vraisemblance est : 
14 q 1 


n /2 n 
L(x,,..….,x,;, 0) = [2 (-5x) = (£) exp (4 >. 
i=1 i=1 


Le rapport des vraisemblances, L, sous H,, et L, sous H;, s’écrit donc : 


Lo 1 n/2 1 n à 
fe CE 
m=(y) w-30-m}x 


Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maxi- 
mum, définit la région critique par la condition A < k, qui est donc ici équivalente, 


en prenant les logarithmes, à : 


n 
1 
<= 0) >r<k 
i=1l 
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Tests d'hypothèses 


Puisque 9, > 1, cette région critique W est définie par la condition : 


n 
e<c 
i=1 


La valeur du seuil C est déterminée par : 


n 
a= ru lan = PS: x < cie -1) 
i=1 


Sous A, les v.a. X'; sont normales, centrées, réduites et indépendantes, donc Re X : 
suit une loi du khi-deux à n degrés de liberté. La valeur du seuil C est donc celle du 
fractile d'ordre 1 — « de la loi La région critique est indépendante de la valeur 
choisie pour ©, donc elle est aussi celle du test UPP pour l'alternative H; : 0 > 1. La 
fonction puissance est définie pour 9 > 1 par : 


n 
n(@) = P(W|H;)= P CS x2<é0S ) 
i=1 
Elle se calcule à partir de la fonction de répartition F, de la loi x? par : 
n(0) = F,(0C) 


Pour n = 15 et « = 0,05 on lit dans la table 5 la valeur C = 7,26. Pour 0 = 3 la 
puissance vaut alors # (3) = F5 (21,78) = 0,9. 


L'hypothèse alternative étant une hypothèse multiple, on détermine d’abord la région 
critique du test entre les deux hypothèses simples : 


H :6=5 
H,:060=0. 


avec 6, quelconque, mais vérifiant o, > 5. L'expression de la vraisemblance est : 


1 1 
EGssse) = I ——=% {- Le - 100 } 
oV2r 26 


n 
1 1 2 
ex —— D _.(x; — 100 

(- =) P{ 20? Ze | } 
Le rapport des vraisemblances, L, sous H,, et L, sous H;, s’écrit donc : 

Lo [x] n 1 1 1 . 2 

— =|— == | — - — . — 100 

"a É ) Fe { 2 G L)Xe À 


Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 
définit la région critique par la condition Zn < k, qui est donc ici équivalente, en prenant 


n 
1f1 1 ; 
DNS Ce 00) SE 
12 1) 


i= 


les logarithmes, à : 
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Puisque 6? > 25, cette région critique W est définie par la condition : 


n 
Xe? — 100) > C 
i=] 


La valeur du seuil C est déterminée par : 


a = P(W|Ho) = P (Sa — 100 > C|o = s) 


i=1l 


Sous A, les v.a. X;— 100 sont normales, centrées, d’écart type o = 5 et indépendantes, 
donc > 1 ; — 100)°/25 suit une loi du khi-deux à n degrés de liberté. La valeur 
de C/25 est donc celle du fractile d’ordre 1—a de la loi pe La région critique est 
indépendante de la valeur choisie pour ©, donc elle est aussi celle du test UPP pour 
l’alternative H, : o > 5. La fonction puissance est définie pour o > 5 par : 


i=1l 


no) = P(W|H)) = P (Sa — 100) > Co > s) 


Elle se calcule à partir de la fonction de répartition F, de la loi La par : 


C 
= 1-8, (5) 


Pour n = 10 et & = 0,05 on lit dans la table 5 la valeur C = 25 x 18,3 —457,5. 


Il s’agit de tester l’hypothèse H, : À = 2 contre l’hypothèse H, : À < 2 à par- 
tir d’un échantillon de taille n = 6. On effectue d’abord le test d’hypothèses simples 
H, : À =2 contre H, : À = À, avec À, quelconque, mais vérifiant 1, < 2. Le rapport 
des vraisemblances, L, sous H,, et L, sous H;, s'écrit : 


Lo _— e 2-4) 2 Ji 
L; À 


Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 
définit la région critique par la condition Ti < k, qui est donc ici équivalente, en prenant 
les logarithmes, à : 


n 
Gn2—In4) Ÿ x; < ki 
i=1l 


Puisque À, < 2, la région critique W est définie par la condition : 


n 
Dx<c 
i=1l 


La valeur du seuil C est déterminée par : 


n 
| x<cu=2) 
i=1 
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Tests d'hypothèses 


C’est donc le fractile d’ordre « de la loi de Poisson de paramètre 2n. Pour n = 6 et 
a@ = 0,05 on lit C = 6. La région critique est indépendante de la valeur choisie pour 
À, donc elle est aussi celle du test UPP pour l'alternative H;, : À < 2. Au bout de 
six mois, on considère que le contrat a été efficace si on observe un nombre de pannes 
inférieur ou égal à 6. 
Les deux hypothèses sont multiples. On détermine d’abord la région critique du test 
entre les deux hypothèses simples : 

H5 :m= mo 

H 1 :m= m; 


avec mQ et m, quelconques, mais vérifiant mp < 3 etm, > 3. La vraisemblance s’écrit : 


n 
1 1 2 
L(x;,...,Xx,;m) = exp {- Den} 
2 
V2z i=1 


La forme de la région critique, donnée par le théorème de Neyman et Pearson, est 
Lo/L, < k, ce qui en passant aux logarithmes conduit à l’inégalité : 


=; D [Gi — mo) — (x; m7] < In k 
i=1 


Elle est équivalente, après développement du crochet, à : 
(nm, — mo)x, > k; 
ayant posé x, = . ZX, x;. Cette région critique est indépendante des valeurs de my et 
m, qui vérifient toujours m, — mp > O0. C’est donc celle du test UPP pour H, : m <3 
contre H, : m > 3etse définit par : 
x, 2 C 

On peut aussi appliquer le théorème de Lehmann. Le rapport des vraisemblances 
s'écrit : 

L(x,,...,x,: 0) n,,2 12 J= 

———— = exp |—--(9" —-0 *)+n(0 —-0 x, | 

LA, ,%:01) 2] 2 AB OR 
C’est une fonction croissante de x, pour 0 > 0'donc x, > C définit la région critique 
d’un test UPP. La valeur de la constante C est déterminée par : 

a = P(W Im =3) = P(X, > CIm=3) 

Pour m = 3, la moyenne empirique X: suit la loi N (à 1/ Vn } donc en centrant et 


réduisant on obtient la condition : 


= r(u> c=) 
1/n 


où U est une v.a. de loi N(0, 1). Ainsi la constante C est définie par : 


C=3+7 
n 
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où u est le fractile d’ordre 1—a de la loi N(0, 1). Pour un risque « = 0,05 on lit dans 
la table 2 le fractile u = 1,6449 d’où une région critique définie pour ñn = 100 par : 


W = CE > X100)/X100 À 3, 16} 


La fonction puissance du test est : 


P(x, >3+4im>3)= P{U > VnG-m)+1,645) 
= 1-® 1,645 — V/n(m 3) 
où ® est la f.r.de la loi N(0, 1). 


8.10 Les hypothèses en présence sont de la même forme que dans l’exercice précédent. 
Mais ici, pour m = 6, la loi de la moyenne empirique X, est inconnue et nous ne 
pouvons pas déterminer le seuil. Nous allons utiliser une autre statistique, de loi 


n(m) 


connue pour m = 6, qui sera Vn (&, _ 6) /S,, de loi de Student à n — 1 degrés de 
liberté. La région critique est définie par la condition : 


> C 


On détermine la valeur de C par : 


X ; 06 
= r(vi ne > cim =) 


n 


Pour n = 12 et a = 0,025 on lit dans la table 6 la valeur C = 2,201. On ne peut pas 
calculer la fonction puissance qui est définie par : 


X,-6 X,— e 
nom =P( ya 2 >cm>6)=r( nl > cn" S 
$, S, S, 


puisque C — Vn = est une v.a 
n 


8.11 Nous allons appliquer le théorème de Lehmann. L'expression de la vraisemblance est : 


ei vx 1 de à 1 
Enr 


pour x; >01<i<n. 


Le rapport des vraisemblances s’écrit : 


De (9) on [à VF] 


on? 


C’est une fonction croissante de 5, = DE 4/x; pour 8 > 0! donc s, > C définit la 
région critique d’un test UPP. La valeur de la constante C est déterminée par : 


P(WI® = 1) = OUE c=1) 
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Tests d'hypothèses 


Nous allons d’abord déterminer la loi de la v.a. Y = 1X à partir de sa fonction de 
répartition définie par : 


GO=P<H=P(VX<y)=P(X<»)=F (5) 


pour y > 0, F étant la fr. de X. On obtient la densité par dérivation, soit pour y > 0 : 


g = 2yf (y?) = ge 0 


On reconnaît la loi exponentielle de paramètre 1/8, ou loi 7(1,1/8). La va. 
S, = >, VX; est la somme de n v.a. indépendantes et de même loi 7(1, 1/8), donc 
suit une loi y(n, 1/0). On utilise le résultat du chapitre 3 $ 2.5 où on avait établi que 


25, CES . On a donc ici : 


n 
sr (EV>cme1)-r05,220 
=] 


Ainsi, 2C est le fractile d'ordre 1—a de la loi 4 . Pour & = 0,01 et n = 15, on lit dans 
la table 5 la valeur 2C = 50, 892 soit un seuil C = 25,45. La fonction puissance du 


test est définie pour 0 > 1 par : 
n 
n(@) = P CS YX;,>C|8> ) = P(2S,/0 >2C/0) =1- K(2C/6) 
i=1 


avec K qui est la fr. de la loi 4 | 


Nous allons associer à une machine de type A (resp. B) une variable indicatrice de 
Bernoulli X (resp. Y) de paramètre p, (resp. p,) . On dispose d’échantillons de ces 
deux lois, d’effectifs respectifs n, = 80 et n, = 60, pour effectuer le test : 


{ HG : Pi = P2 e{ H6 : p; — pa =0 
Hi : pi #2 H; :p\-p2 #0 


Les moyennes empiriques X et Y de ces deux échantillons permettent de définir l’es- 
timateur sans biais X — Y du paramètre à tester 0 = Pi — P2 . Sa loi approchée est 
une loi normale d’espérance 8 et d’écart type inconnu © = Ÿ. P141/n1 + P24/n2 où 
4 = 1—-p;etqg = 1 —p,. Sous l'hypothèse nulle, on estime la valeur commune 
P = P;, = P) par la réunion des deux échantillons : 


54 Y ni m 
P= —— = ) X;+ | y; 
ni +m m+tm\s = 


i= 


Cet  estimateur permet aussi d’estimer dans ce cas l'écart type 


6 = V? (1 — p) (1/n1 + 1/n). On effectue alors le test à l’aide de la v.a. normalisée : 
X-Y 


NE USE 
P(1-—$) (1/n; +1/m) 
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dont on peut admettre, compte tenu des tailles d’échantillon, qu’elle suit approxi- 
mativement une loi normale standard dans l’hypothèse nulle. La région critique est 
définie par lô > C, où on retient comme valeur approchée du seuil C celle qui vérifie 
a = P(IU] > C), avec U de loi N(0, 1). Pour la valeur standard « = 0,05 la région 
critique est définie par lô| > 1,96. On obtient pour ces échantillons 


x = 0,625, y = 0,667, = 0,643, 4/P(1- P) (1/n1 + 1/m) = 0,08 


et lô| = 0,51 donc on accepte l’hypothèse nulle d'équivalence des deux types de 
machines. 


Chaque série d’observations est un échantillon des v.a. X et Y, de lois respectives 
N(m,,0,) et N(m;,0;), ces quatre paramètres étant inconnus. Les deux échantillons 
proviennent de la même loi si les paramètres sont égaux deux à deux. Le premier test à 
effectuer sur les espérances est : 
{ Ho, :m=m e{ H5 : m -m; =0 
Hi :m£m H, :m-m £0 


et utilise pour cela l’estimateur sans biais X — Y de m,—m, . Cet estimateur suit une loi 
normale centrée sous H,,, mais de variance inconnue 6? / n +0; / n, où n, et n, sont les 
effectifs des échantillons respectifs des lois de X et Y. On utilise donc les estimateurs 
sans biais de 6? et 6 qui sont respectivement : 


Si on remplace l’écart type inconnu par son estimateur 4 /.S 2 /n+s$S . / n, pour réduire 


X —Y, on n’obtiendra pas une loi de Student. Il faut pour cela que l’écart type des deux 
échantillons soit le même. On doit donc faire le test préalable d’égalité des variances : 


0e. PS LEE 
— SE de 


H:0#0 Hi, :0?/o #1 


On accepte l’hypothèse nulle si le rapport S2? À S° est voisin de 1, soit une région 
d’acceptation de la forme : 


a < 52 <b 
y 
Si on répartit le risque « de façon symétrique, les valeurs des constantes a et b sont 


définies par : 
S” S? 
TePl—=<aH)=P| —=>bH 
2 52 s? 


avec Si/S? qui suit une loi de Fisher-Snedecor F(n, — 1,n, — 1) sous A, Pour la 


valeur standard & = 0,05 on lit dans la table 7 le fractile a = 1 = 0,56 et b = 1,74. 
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La valeur calculée de S? / S? pour cet échantillon est 1,44 donc on accepte l’égalité 
des variances. On retient alors comme estimateur sans biais de la variance commune 
2 2 2 


© — 0 — 0: 


2 2 
s2= (m1) S5+(m—1)5; 
n, + —2 
La région critique du test initial est alors définie par : 

Een 


S4y1/n, +1l/nm 


>t 


Le seuil f est déterminé par : 
Er] 
S'\/1/n;, +1/m 
C’est donc le fractile d’ordre 1—«/2 de la loi de Student à n, +n, —2 degrés de liberté. 


Pour & = 0,05 on lit dans la table 6 le fractile ft = 1,984. Pour cet échantillon, on 
observe s = 1,52 et: 


= 
sY1/n, +1/n 


On refuse donc l’égalité des moyennes de ces deux lois. 


= —9,77 


Dans l’hypothèse nulle d'indépendance des caractéristiques de taille et de CSP, la ré- 


partition de la population est obtenue à partir du produit des effectifs marginaux. Par 


exemple, le nombre d'ouvriers de moins de 165 cm serait dans ce cas IRL) = 


290,6, arrondi à 291 puisqu'il s’agit d’effectifs entiers. On aboutit ainsi au tableau 
suivant : 


Ouvriers | Employés | Cadres | Total 


Moins de 165 cm 291 73 49 413 
De 165 à moins de 170 cm 457 115 77 649 
De 170 à moins de 175 cm 645 163 109 917 
175 cm et plus 507 128 86 721 


Total 1900 479 321 2700 


La région critique est de la forme D,, > C où C a comme valeur approchée le fractile 
d’ordre 1—a de la loi du khi-deux à six degrés de liberté, pour un test de risque de 
première espèce «. Pour &« = 0,05 on lit dans la table 5 la valeur C = 12,6. La valeur 
de la statistique utilisée pour ce test est ici D, = 58,2 donc on rejette l’hypothèse 
d’indépendance. La conclusion serait la même pour un risque & = 0,01, le seuil étant 
C = 16,8. 
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Tables statistiques 


Table 1 : Fonction de répartition de la loi normale centrée réduite 

Table 2 : Fractiles de la loi normale centrée réduite 

Table3 : Loi binômiale 

Table 4 : Loi de Poisson 

Table 5 : Fractiles de la loi 72 

Table 6 : Fractiles de la loi de Student T,, 

Table 7 : Fractiles d'ordre 0,95 de la loi de Fisher-Snedecor 

Table 7 (suite) : Fractiles d'ordre 0,975 de la loi de Fisher-Snedecor 
Abaque 1 : intervalles de confiance pour une proportion (bilatéral de niveau 
0,90 ou unilatéral de niveau 0,95) 

Abaque 2 : intervalles de confiance pour une proportion (bilatéral de niveau 
0,95 ou unilatéral de niveau 0,975) 


Ces tables sont publiées avec l’aimable autorisation de la Revue de statistique 
appliquée, numéro spécial Aide-mémoire pratique des techniques statistiques, éditions 
du CERESTA, 1986. 
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Table 1 — Fonction de répartition de la loi normale centrée réduite 
Probabilité F{u) d'une valeur inférieure à u. 


0,01 


0,04 


0,05 


0,06 


0,07 


0,08 


0,09 


NN ss — = — — — — 
_ O © “M oO U1 BR © ND = © 


DNONI 
5 w ND 


DNNNN 
YO 01 


© © 


0,5040 
0,5438 
0,5832 
0,6217 
0,6591 


0,6950 
0,7291 
0,7611 
0,7910 
0,8186 


0,8438 
0,8665 
0,8869 
0,9049 
0,9207 


0,9345 
0,9463 
0,9564 
0,9649 
0,9719 


0,9779 
0,9826 
0,9864 
0,9896 
0,9920 


0,9940 
0,9955 
0,9966 
0,9975 
0,9982 


0,5120 | 0,5160 
0,5517 | 0,5557 
0,5910 | 0,5948 
0,6293 | 0,6331 
0,6664 | 0,6700 


0,7019 | O,7054 
0,7357 | 0,7389 
0,7673 | 0,7704 
0,7967 | 0,7995 
0,8238 | 0,8264 


0,8485 | 0,8508 
0,8708 | 0,8729 
0,8907 | 0,8925 
0,9082 | 0,9099 
0,9236 | 0,9251 


0,9370 | 0,9382 
0,9484 | 0,9495 
0,9582 | 0,9591 
0,9664 | 0,9671 
0,9732 | 0,9738 


0,9788 | 0,9793 
0,9834 | 0,9838 


0,9875 
0,9904 


0,9925 | 0,9927 


0,9943 | 0,9945 
0,9957 | 0,9959 
0,9968 | 0,9969 
0,9977 | 0,9977 
0,9983 | 0,9984 


0,5199 
0,5596 
0,5987 
0,6368 
0,6736 


0,7088 
0,7422 
0,7734 
0,8023 
0,8289 


0,8531 
0,8749 
0,8944 
0,9115 
0,9265 


0,9394 
0,9505 
0,9599 
0,9678 
0,9744 


0,9798 
0,9842 
0,9878 
0,9906 
0,9929 


0,9946 
0,9960 
0,9970 
0,9978 
0,9984 


0,5239 
0,5636 
0,6026 
0,6406 
0,6772 


0,7123 
0,7454 
0,7764 
0,8051 
0,8315 


0,8554 
0,8770 
0,8962 
0,9131 
0,9279 


0,9406 
0,9515 
0,9608 
0,9686 
0,9750 


0,9803 
0,9846 
0,9881 
0,9909 
0,9931 


0,9948 
0,9961 
0,9971 
0,9979 
0,9985 


0,5279 
0,5675 
0,6064 
0,6443 
0,6808 


0,7157 
0,7486 
0,7794 
0,8078 
0,8340 


0,8577 
0,8790 
0,8980 
0,9147 
0,9292 


0,9418 
0,9525 
0,9616 
0,9693 
0,9756 


0,9808 
0,9850 
0,9884 
0,9911 
0,9932 


0,9949 
0,9962 
0,9972 
0,9979 
0,9985 


0,5319 
0,5714 
0,6103 
0,6480 
0,6844 


0,7190 
0,7517 
0,7823 
0,8106 
0,8365 


0,8599 
0,8810 
0,8997 
0,9162 
0,9306 


0,9429 
0,9535 
0,9625 
0,9699 
0,9761 


0,9812 
0,9854 
0,9887 
0,9913 
0,9934 


0,9951 
0,9963 
0,9973 
0,9980 
0,9986 


0,5359 
0,5753 
0,6141 
0,6517 
0,6879 


0,7224 
0,7549 
0,7852 
0,8133 
0,8389 


0,8621 
0,8830 
0,9015 
0,9177 
0,9319 


0,9441 
0,9545 
0,9633 
0,9706 
0,9767 


0,9817 
0,9857 
0,9890 
0,9916 
0,9936 


0,9952 
0,9964 
0,9974 
0,9981 
0,9986 


Tables pour les grandes valeurs de u 


3,0 


3,1 


3,2 


3,3 


3,4 


3,5 


3,6 


3,8 


4,0 


4,5 


0,99865 


0,99904 


0,99931 


0,99952 


0,99966 | 0,99976 


0,999841 |0,999928 


0,999968 


0,999997 
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Table 2 — Fractiles d'ordre P de la loi normale centrée réduite. 


Lecture de la table 2 des fractiles. 


Si P < 0,50 : le fractile est négatif, donc on ajoute le signe — à la valeur lue dans la table. 
0,004 < troisième décimale de P 
i (en haut) 


2 premières décimales de P (à gauche de la table) 
Le fractile d’ordre 0,244 vaut : — 0,6935. 
Si P > 0,50 : on lit normalement. 
2 premières décimales de P (à droite) 


' 


1,7060 10,951 


À 


0,006 < troisième décimale de P (en bas) 
Le fractile d’ordre 0,956 vaut : 1,7060. 


P | 0,000 | 0,001 | 0,002 | 0,003 | 0,004 | 0,005 | 0,006 | 0,007 | 0,008 | 0,009 | 0,010 


0,00 co 3,0902 | 2,8782 | 2,7478 | 2,6521 | 2,5758 | 2,5121 | 2,4573 | 2,4089 | 2,3656 | 2,3263 | 0,99 
0,01 | 2,3263 | 2,2904 | 2,2571 | 2,2262 | 2,1973 | 2,1701 | 2,1444 | 2,1201 | 2,0969 | 2,0749 | 2,0537 | 0,98 
0,02 | 2,0537 | 2,0335 | 2,0141 | 1,9954 | 1,9774 | 1,9600 | 1,9431 | 1,9268 | 1,9110 | 1,8957 | 1,8808 | 0,97 
0,03 | 1,8808 | 1,8663 | 1,8522 | 1,8384 | 1,8250 | 1,8119 | 1,7991 | 1,7866 | 1,7744 | 1,7624 | 1,7507 | 0,96 
0,04 | 1,7507 | 1,7392 | 1,7279 | 1,7169 | 1,7060 | 1,6954 | 1,6849 | 1,6747 | 1,6646 | 1,6546 | 1,6449 | 0,95 


0,05 | 1,6449 | 1,6352 | 1,6258 | 1,6164 | 1,6072 | 1,5982 | 1,5893 | 1,5805 | 1,5718 | 1,5632 | 1,5548 | 0,94 
0,06 | 1,5548 | 1,5464 | 1,5382 | 1,5301 | 1,5220 | 1,5141 | 1,5063 | 1,4985 | 1,4909 | 1,4833 | 1,4758 | 0,93 
0,07 | 1,4758 | 1,4684 | 1,4611 | 1,4538 | 1,4466 | 1,4395 | 1,4325 | 1,4255 | 1,4187 | 1,4118 | 1,4051 | 0,92 
0,08 | 1,4051 | 1,3984 | 1,3917 | 1,3852 | 1,3787 | 1,3722 | 1,3658 | 1,3595 | 1,3532 | 1,3469 | 1,3408 | 0,91 
0,09 | 1,3408 | 1,3346 | 1,3285 | 1,3225 | 1,3165 | 1,3106 | 1,3047 | 1,2988 | 1,2930 | 1,2873 | 1,2816 | 0,90 


0,10 | 1,2816 | 1,2759 | 1,2702 | 1,2646 | 1,2591 | 1,2536 | 1,2481 | 1,2426 | 1,2372 | 1,2319 | 1,2265 | 0,89 
1,2265 | 1,2212 | 1,2160 | 1,2107 | 1,2055 | 1,2004 | 1,1952 | 1,1901 | 1,1850 | 1,1800 | 1,1750 | 0,88 
1,1750 | 1,1700 | 1,1650 | 1,1601 | 1,1552 | 1,1503 | 1,1455 | 1,1407 | 1,1359 | 1,1311 | 1,1264 | 0,87 
1,1264 | 1,1217 | 1,1170 | 1,1123 | 1,1077 | 1,1031 | 1,0985 | 1,0939 | 1,0893 | 1,0848 | 1,0803 | 0,86 
1,0803 | 1,0758 | 1,0714 | 1,0669 | 1,0625 | 1,0581 | 1,0537 | 1,0494 | 1,0450 | 1,0407 | 1,0364 | 0,85 


Se nd 


1,0364 | 1,0322 | 1,0279 | 1,0237 | 1,0194 | 1,0152 | 1,0110 | 1,0069 | 1,0027 | 0,9986 | 0,9945 | 0,84 
0,9945 | 0,9904 | 0,9863 | 0,9822 | 0,9782 | 0,9741 | 0,9701 | 0,9661 | 0,9621 | 0,9581 | 0,9542 | 0,83 
0,9542 | 0,9502 | 0,9463 | 0,9424 | 0,9385 | 0,9346 | 0,9307 | 0,9269 | 0,9230 | 0,9192 | 0,9154 | 0,82 
0,9154 | 0,9116 | 0,9078 | 0,9040 | 0,9002 | 0,8965 | 0,8927 | 0,8890 | 0,8853 | 0,8816 | 0,8779 | 0,81 
0,8779 | 0,8742 | 0,8705 | 0,8669 | 0,8633 | 0,8596 | 0,8560 | 0,8524 | 0,8488 | 0,8452 | 0,8416 | 0,80 


s = 


O0OQO0OO COCO 


s 


SO © I O U1 BR & ND D — 


£o © 
ND = 
e) 


0,8416 | 0,8381 | 0,8345 | 0,8310 | 0,8274 | 0,8239 | 0,8204 | 0,8169 | 0,8134 | 0,8099 | 0,8064 | 0,79 
0,21 | 0,8064 | 0,8030 | 0,7995 | 0,7961 | 0,7926 | 0,7892 | 0,7858 | 0,7824 | 0,7790 | 0,7756 | 0,7722 | 0,78 
0,22 | 0,7722 | 0,7688 | 0,7655 | 0,7621 | 0,7588 | 0,7554 | 0,7521 | 0,7488 | 0,7454 | 0,7421 | 0,7388 | 0,77 
0,23 | 0,7388 | 0,7356 | 0,7323 | 0,7290 | 0,7257 | 0,7225 | 0,7192 | 0,7160 | 0,7128 | 0,7095 | 0,7063 | 0,76 
0,24 | 0,7063 | 0,7031 | 0,6999 | 0,6967 | 0,6935 | 0,6903 | 0,6871 | 0,6840 | 0,6808 | 0,6776 | 0,6745 | 0,75 


0,25 | 0,6745 | 0,6713 | 0,6682 | 0,6651 | 0,6620 | 0,6588 | 0,6557 | 0,6526 | 0,6495 | 0,6464 | 0,6433 | 0,74 
0,26 | 0,6433 | 0,6403 | 0,6372 | 0,6341 | 0,6311 | 0,6280 | 0,6250 | 0,6219 | 0,6189 | 0,6158 | 0,6128 | 0,73 
0,27 | 0,6128 | 0,6098 | 0,6068 | 0,6038 | 0,6008 | 0,5978 | 0,5948 | 0,5918 | 0,5888 | 0,5858 | 0,5828 | 0,72 
0,28 | 0,5828 | 0,5799 | 0,5769 | 0,5740 | 0,5710 | 0,5681 | 0,5651 | 0,5622 | 0,5592 | 0,5563 | 0,5534 | 0,71 
0,29 | 0,5534 | 0,5505 | 0,5476 | 0,5446 | 0,5417 | 0,5388 | 0,5359 | 0,5330 | 0,5302 | 0,5273 | 0,5244 | 0,70 


0,010 | 0,009 | 0,008 | 0,007 | 0,006 | 0,005 | 0,004 | 0,003 | 0,002 | 0,001 | 0,000 | P 
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Table 2 (suite) — Fractiles d'ordre P de la loi normale centrée réduite. 


0,000 


0,001 


0,002 


0,003 | 0,004 | 0,005 


0,006 


0,007 | 0,008 


0,009 


0,010 


0,5244 
0,4959 
0,4677 
0,4399 
0,4125 


0,3853 
0,3585 
0,3319 
0,3055 
0,2793 


0,2533 
0,2275 
0,2019 
0,1764 
0,1510 


0,1257 
0,1004 
0,0753 
0,0502 
0,0251 


0,5215 
0,4930 
0,4649 
0,4372 
0,4097 


0,3826 
0,3558 
0,3292 
0,3029 
0,2767 


0,2508 
0,2250 
0,1993 
0,1738 
0,1484 


0,1231 
0,0979 
0,0728 
0,0476 
0,0226 


0,5187 
0,4902 
0,4621 
0,4344 
0,4070 


0,3799 
0,3531 
0,3266 
0,3002 
0,2741 


0,2482 
0,2224 
0,1968 
0,1713 
0,1459 


0,1206 
0,0954 
0,0702 
0,0451 
0,0201 


0,5158 | 0,5129 | 0,5101 
0,4874 | 0,4845 | 0,4817 
0,4593 | 0,4565 | 0,4538 
0,4316 | 0,4289 | 0,4261 
0,4043 | 0,4016 | 0,3989 


0,3772 | 0,3745 | 0,3719 
0,3505 | 0,3478 | 0,3451 
0,3239 | 0,3213 | 0,3186 
0,2976 | 0,2950 | 0,2924 
0,2715 | 0,2689 | 0,2663 


0,2456 | 0,2430 | 0,2404 
0,2198 | 0,2173 | 0,2147 
0,1942 | 0,1917 | 0,1891 
0,1687 | 0,1662 | 0,1637 
0,1434 | 0,1408 | 0,1383 


0,1181 | 0,1156 | 0,1130 
0,0929 | 0,0904 | 0,0878 
0,0677 | 0,0652 | 0,0627 
0,0426 | 0,0401 | 0,0376 
0,0175 | 0,0150 | 0,0125 


0,5072 
0,4789 
0,4510 
0,4234 
0,3961 


0,3692 
0,3425 
0,3160 
0,2898 
0,2637 


0,2378 
0,2121 
0,1866 
0,1611 
0,1358 


0,1105 
0,0853 
0,0602 
0,0351 
0,0100 


0,5044 | 0,5015 
0,4761 | 0,4733 
0,4482 | 0,4454 
0,4207 | 0,4179 
0,3934 | 0,3907 


0,3665 | 0,3638 
0,3398 | 0,3372 
0,3134 | 0,3107 
0,2871 | 0,2845 
0,2611 | 0,2585 


0,2353 | 0,2327 
0,2096 | 0,2070 
0,1840 | 0,1815 
0,1586 | 0,1560 
0,1332 | 0,1307 


0,1080 | 0,1055 
0,0828 | 0,0803 
0,0577 | 0,0552 
0,0326 | 0,0301 
0,0075 | 0,0050 


0,4987 
0,4705 
0,4427 
0,4152 
0,3880 


0,3611 
0,3345 
0,3081 
0,2819 
0,2559 


0,2301 
0,2045 
0,1789 
0,1535 
0,1282 


0,1030 
0,0778 
0,0527 
0,0276 
0,0025 


0,4959 
0,4677 
0,4399 
0,4125 
0,3853 


0,3585 
0,3319 
0,3055 
0,2793 
0,2533 


0,2275 
0,2019 
0,1764 
0,1510 
0,1257 


0,1004 
0,0753 
0,0502 
0,0251 
0,0000 


0,010 


0,009 


0,008 


0,007 | 0,006 | 0,005 


0,004 


0,003 | 0,002 


0,001 


0,000 


Grandes valeurs de u 


104 


105 


106 


1077 


1078 10? 


up 


3,7190 


4,2649 


4,7534 


5,1993 


5,6120 | 5,9978 
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Table 3 -— Loi binômiale. 


Probabilités cumulées 


Probabilités cumulées Pr (X< c) 25 Cip k(1-p}TK 
n|c =1l%|p=2%|p=3%|p=4%|p=5%|p=6%|p=7%|p=8%X|p=9%X|p=10% 
0 |0,9044 | 0,8171 | 0,7374 | 0,6648 | 0,5987 | 0,5386 | 0,4840 | 0,4344 | 0,3894 | 0,3486 
1 [0,9957 | 0,9838 | 0,9655 | 0,9418 | 0,9139 | 0,8824 | 0,8483 | 0,8121 | 0,7746 | 0,7361 
2 |0,9999 | 0,9991 | 0,9972 | 0,9938 | 0,9885 | 0,9812 | 0,9717 | 0,9599 | 0,9460 | 0,9298 
3 |1 1 0,9999 | 0,9996 | 0,9990 | 0,9980 | 0,9964 | 0,9942 | 0,9912 | 0,9872 
10] 4 1 1 0,9999 | 0,9998 | 0,9997 | 0,9994 | 0,9990 | 0,9984 
5 1 1 1 1 0,9999 | 0,9999 
6 1 1 
0 |0,8179 | 0,6676 | 0,5438 | 0,4420 | 0,3585 | 0,2901 | 0,2342 | 0,1887 | 0,1516 | 0,1216 
1 [0,9831 | 0,9401 | 0,8802 | 0,8103 | 0,7358 | 0,6605 | 0,5869 | 0,5169 | 0,4516 | 0,3917 
2 |0,9990 | 0,9929 | 0,9790 | 0,9561 | 0,9245 | 0,8850 | 0,8390 | 0,7879 | 0,7334 | 0,6769 
3 0,9994 | 0,9973 | 0,9926 | 0,9841 | 0,9710 | 0,9529 | 0,9294 | 0,9007 | 0,8670 
20|4 1 0,9997 | 0,9990 | 0,9974 | 0,9944 | 0,9893 | 0,9817 | 0,9710 | 0,9568 
5 1 0,9999 | 0,9997 | 0,9991 | 0,9981 | 0,9962 | 0,9932 | 0,9887 
6 1 1 0,9999 | 0,9997 | 0,9994 | 0,9987 | 0,9976 
7 1 1 0,9999 | 0,9998 | 0,9996 
8 1 1 0,9999 
9 1 
0 |0,7397 | 0,5455 | 0,4010 | 0,2939 | 0,2146 | 0,1563 | 0,1134 | 0,0820 | 0,0591 | 0,0424 
1 [0,9639 | 0,8794 | 0,7731 | 0,6612 | 0,5535 | 0,4555 | 0,3694 | 0,2958 | 0,2343 | 0,1837 
2 |0,9967 | 0,9783 | 0,9399 | 0,8831 | 0,8122 | 0,7324 | 0,6488 | 0,5654 | 0,4855 | 0,4114 
3 |0,9998 | 0,9971 | 0,9881 | 0,9694 | 0,9392 | 0,8974 | 0,8450 | 0,7842 | 0,7175 | 0,6474 
30 | 4 |0,9999 | 0,9996 | 0,9982 | 0,9937 | 0,9844 | 0,9685 | 0,9447 | 0,9126 | 0,8723 | 0,8245 
5 |1 1 0,9997 | 0,9989 | 0,9967 | 0,9921 | 0,9838 | 0,9707 | 0,9519 | 0,9268 
6 1 0,9999 | 0,9994 | 0,9983 | 0,9960 | 0,9918 | 0,9848 | 0,9742 
7 1 0,9999 | 0,9997 | 0,9992 | 0,9980 | 0,9959 | 0,9922 
8 1 0,9999 | 0,9999 | 0,9996 | 0,9910 | 0,9980 
9 1 1 0,9999 | 0,9998 | 0,9995 
10 1 1 0,9999 
11 1 
0 |0,6050 | 0,3642 | 0,2181 | 0,1299 | 0,0769 | 0,0453 | 0,0266 | 0,0155 | 0,0090 | 0,0052 
1 [0,9106 | 0,7358 | 0,5553 | 0,4005 | 0,2794 | 0,1900 | 0,1265 | 0,0827 | 0,0532 | 0,0338 
2 |0,9862 | 0,9216 | 0,8106 | 0,6767 | 0,5405 | 0,4162 | 0,3108 | 0,2260 | 0,1605 | 0,1117 
3 |0,9984 | 0,9822 | 0,9372 | 0,8609 | 0,7604 | 0,6473 | 0,5327 | 0,4253 | 0,3303 | 0,2503 
50| 4 |0,9999 | 0,9968 | 0,9832 | 0,9510 | 0,8964 | 0,8206 | 0,7290 | 0,6290 | 0,5277 | 0,4312 
5 |1 0,9995 | 0,9963 | 0,9856 | 0,9622 | 0,9224 | 0,8650 | 0,7919 | 0,7072 | 0,6161 
6 0,9999 | 0,9993 | 0,9964 | 0,9882 | 0,9711 | 0,9417 | 0,8981 | 0,8404 | 0,7702 
7 1 0,9999 | 0,9992 | 0,9968 | 0,9906 | 0,9780 | 0,9562 | 0,9232 | 0,8779 
8 1 0,9999 | 0,9992 | 0,9973 | 0,9927 | 0,9834 | 0,9672 | 0,9421 
9 1 0,9998 | 0,9993 | 0,9978 | 0,9944 | 0,9875 | 0,9755 
10 1 0,9998 | 0,9994 | 0,9983 | 0,9957 | 0,9906 
11 1 0,9999 | 0,9995 | 0,9987 | 0,9968 
12 1 0,9999 | 0,9996 | 0,9990 
13 1 0,9999 | 0,9997 
14 1 0,9999 
15 1 
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Table 4 - Loi de Poisson. 


Probabilités individuelles Pr(k) = enr 
kiIm=01|m=02|m=03|m=04|m=05|m=06|m=0,7|m=0,8| m=0,9 
0 | 0,9048 | 0,8187 | 0,7408 | 0,6703 | 0,6065 | 0,5488 | 0,4966 | 0,4493 | 0,4066 
1 | 0,0905 | 0,1637 | 0,2222 | 0,2681 | 0,3033 | 0,3293 | 0,3476 | 0,3595 | 0.3659 
2 | 0,0045 | 0,0164 | 0,0333 | 0,0536 | 0,0758 | 0,0988 | 0,1217 | 0,1438 | 0,1647 
3 | 0,0002 | 0,0011 | 0,0033 | 0,0072 | 0,0126 | 0,0198 | 0.0284 | 0,0383 | 0,0494 
4 0,0003 | 0,0003 | 0,0007 | 0,0016 | 0,0030 | 0,0050 | 0,0077 | 0,0111 
5 0,0001 | 0,0002 | 0,0004 | 0,0007 | 0.0012 | 0,0020 
6 0,0001 | 0,0002 | 0,0003 

Probabilités individuelles Pr(k) = er 
kIm=10|m=15|m=20|m=25|m=-30|m=35|m=40|m=45|m=5,0 
0 | 0,3679 | 0,2231 | 0,1353 | 0,0821 | 0,0498 | 0,0302 | 0,0183 | 0,0111 | 0,0067 
1 0,3679 | 0,3347 | 0,2707 | 0,2052 | 0,1494 | 0,1057 | 0,0733 | 0,0500 | 0,0337 
2 | 0,1839 | 0,2510 | 0,2707 | 0,2565 | 0,2240 | 0,1850 | 0,1465 | 0,1125 | 0,0842 
3 | 0,0613 | 0,1255 | 0,1804 | 0,2138 | 0,2240 | 0,2158 | 0,1954 | 0,1687 0,1404 
4 | 0,0153 | 0,0471 | 0,0902 | 0,1336 | 0,1680 | 0,1888 | 0,1954 | 0,1898 | 0,1755 
5 | 0,0031 | 0,0141 | 0,0361 | 0,0668 | 0,1008 | 0,1322 | 0,1563 | 0,1708 | 0,1755 
6 | 0,0005 | 0,0035 | 0,0120 | 0,0278 | 0,0504 | 0,0771 | 0,1042 | 0,1281 0,1462 
7 | 0,0001 | 0,0008 | 0,0034 | 0,0099 | 0,0216 | 0,0385 | 0,0595 | 0,0824 | 0,1044 
8 0,0001 | 0,0009 | 0,0031 | 0,0081 | 0,0169 | 0,0298 | 0,0463 | 0,0653 
9 0,0002 | 0,0009 | 0,0027 | 0,0066 | 0,0132 | 0,0232 | 0,0363 
10 0,0002 | 0,0008 | 0,0023 | 0,0053 | 0,0104 | 0,0181 
11 0,0002 | 0,0007 | 0,0019 | 0,0043 | 0,0082 
12 0,0001 | 0,0002 | 0,0006 | 0,0016 | 0,0034 
13 0,0001 | 0,0002 | 0,0006 | 0,0013 
14 0,0001 | 0,0002 | 0,0005 
15 0,0001 0,0002 
16 0,0001 
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Table 5 — Fractiles d'ordre P de la loi ge 
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Table 6 — Fractiles d'ordre P de la loi de Student T,. 


0,60 | 0,70 | 0,80 | 0,90 | 0,95 | 0,975 | 0,990 | 0,995 | 0,999 | 0,9995 

1 0,325 | 0,727 | 1,376 | 3,078 | 6,314 | 12,71 | 31,82 | 63,66 | 318,3 | 636,6 
2 0,289 | 0,617 | 1,061 | 1,886 | 2,920 | 4,303 | 6,965 | 9,925 | 22,33 | 31,60 
3 0,277 | 0,584 | 0,978 | 1,638 | 2,353 | 3,182 | 4,541 | 5,841 | 10,22 | 12,94 
4 0,271 | 0,569 | 0,941 | 1,533 | 2,132 | 2,776 | 3,747 | 4,604 | 7,173 | 8,610 
5 0,267 | 0,559 | 0,920 | 1,476 | 2,015 | 2,571 | 3,365 | 4,032 | 5,893 | 6,859 
6 0,265 | 0,553 | 0,906 | 1,440 | 1,943 | 2,447 | 3,143 | 3,707 | 5,208 | 5,959 
7 0,263 | 0,549 | 0,896 | 1,415 | 1,895 | 2,365 | 2,998 | 3,499 | 4,785 | 5,405 
8 0,262 | 0,546 | 0,889 | 1,397 | 1,860 | 2,306 | 2,896 | 3,355 | 4,501 5,041 
9 0,261 | 0,543 | 0,883 | 1,383 | 1,833 | 2,262 | 2,821 | 3,250 | 4,297 | 4,781 
10 0,260 | 0,542 | 0,879 | 1,372 | 1,812 | 2,228 | 2,764 | 3,169 | 4,144 | 4,587 
11 0,260 | 0,540 | 0,876 | 1,363 | 1,796 | 2,201 | 2,718 | 3,106 | 4,025 | 4,437 
12 0,259 | 0,539 | 0,873 | 1,356 | 1,782 | 2,179 | 2,681 | 3,055 | 3,930 | 4,318 
13 0,259 | 0,538 | 0,870 | 1,350 | 1,771 | 2,160 | 2,650 | 3,012 | 3,852 | 4,221 
14 0,258 | 0,537 | 0,868 | 1,345 | 1,761 | 2,145 | 2,624 | 2,977 | 3,787 | 4,140 
15 0,258 | 0,536 | 0,866 | 1,341 | 1,753 | 2,131 | 2,602 | 2,947 | 3,733 | 4,073 
16 0,258 | 0,535 | 0,865 | 1,337 | 1,746 | 2,120 | 2,583 | 2,921 | 3,686 | 4,015 
17 0,257 | 0,534 | 0,863 | 1,333 | 1,740 | 2,110 | 2,567 | 2,898 | 3,646 | 3,965 
18 0,257 | 0,534 | 0,862 | 1,330 | 1,734 | 2,101 | 2,552 | 2,878 | 3,611 | 3,922 
19 0,257 | 0,533 | 0,861 | 1,328 | 1,729 | 2,093 | 2,539 | 2,861 | 3,579 | 3,883 
20 0,257 | 0,533 | 0,860 | 1,325 | 1,725 | 2,086 | 2,528 | 2,845 | 3,552 | 3,850 
21 0,257 | 0,532 | 0,859 | 1,323 | 1,721 | 2,080 | 2,518 | 2,831 | 3,527 | 3,819 
22 0,256 | 0,532 | 0,858 | 1,321 | 1,717 | 2,074 | 2,508 | 2,819 | 3,505 | 3,792 
23 0,256 | 0,532 | 0,858 | 1,319 | 1,714 | 2,069 | 2,500 | 2,807 | 3,485 | 3,767 
24 0,256 | 0,531 | 0,857 | 1,318 | 1,711 | 2,064 | 2,492 | 2,797 | 3,467 | 3,745 
25 0,256 | 0,531 | 0,856 | 1,316 | 1,708 | 2,060 | 2,485 | 2,787 | 3,450 | 3,725 
26 0,256 | 0,531 | 0,856 | 1,315 | 1,706 | 2,056 | 2,479 | 2,779 | 3,435 | 3,707 
27 0,256 | 0,531 | 0,855 | 1,314 | 1,703 | 2,052 | 2,473 | 2,771 | 3,421 | 3,690 
28 0,256 | 0,530 | 0,855 | 1,313 | 1,701 | 2,048 | 2,467 | 2,763 | 3,408 | 3,674 
29 0,256 | 0,530 | 0,854 | 1,311 | 1,699 | 2,045 | 2,462 | 2,756 | 3,396 | 3,659 
30 0,256 | 0,530 | 0,854 | 1,310 | 1,697 | 2,042 | 2,457 | 2,750 | 3,385 | 3,646 
32 0,256 | 0,530 | 0,853 | 1,309 | 1,694 | 2,037 | 2,449 | 2,738 | 3,365 | 3,622 
34 0,255 | 0,529 | 0,852 | 1,307 | 1,691 | 2,032 | 2,441 | 2,728 | 3,348 | 3,601 
36 0,255 | 0,529 | 0,852 | 1,306 | 1,688 | 2,028 | 2,434 | 2,719 | 3,333 | 3,582 
38 0,255 | 0,529 | 0,851 | 1,304 | 1,686 | 2,024 | 2,429 | 2,712 | 3,319 | 3,566 
40 0,255 | 0,529 | 0,851 | 1,303 | 1,684 | 2,021 | 2,423 | 2,704 | 3,307 | 3,551 
50 0,255 | 0,528 | 0,849 | 1,298 | 1,676 | 2,009 | 2,403 | 2,678 | 3,261 | 3,496 
60 0,254 | 0,527 | 0,848 | 1,296 | 1,671 | 2,000 | 2,390 | 2,660 | 3,232 | 3,460 
70 0,254 | 0,527 | 0,847 | 1,294 | 1,667 | 1,994 | 2,381 | 2,648 | 3,211 | 3,435 
80 0,254 | 0,527 | 0,846 | 1,292 | 1,664 | 1,990 | 2,374 | 2,639 | 3,195 | 3,415 
90 0,254 | 0,526 | 0,846 | 1,291 | 1,662 | 1,987 | 2,368 | 2,632 | 3,183 | 3,402 
100 0,254 | 0,526 | 0,845 | 1,290 | 1,660 | 1,984 | 2,365 | 2,626 | 3,174 | 3,389 
200 0,254 | 0,525 | 0,843 | 1,286 | 1,653 | 1,972 | 2,345 | 2,601 | 3,131 | 3,339 
500 0,253 | 0,525 | 0,842 | 1,283 | 1,648 | 1,965 | 2,334 | 2,586 | 3,106 | 3,310 
co 0,253 | 0,524 | 0,842 | 1,282 | 1,645 | 1,960 | 2,326 | 2,576 | 3,090 | 3,291 


© Dunod — Toute reproduction non autorisée est un délit. 


Table 7 — Fractiles d'ordre 0,95 de la loi de Fisher-Snedecor F{v,,v.). 


Tables statistiques 


Vi 


. 1 2 3 4 5 6 7 8 10 12 | 20 | 40 co 

1 161 | 200 | 216 | 225 | 230 | 234 | 237 | 239 | 242 | 244 | 248 | 251 | 252 | 253 | 254 
2 18,5 | 19,0 | 19,2] 19,21 19,3 | 19,3 | 19,41 19,4|19,4119,4|19,41 19,5 | 19,5 | 19,5 | 19,5 
3 10,1 | 9,55 | 9,28 | 9,12 | 9,01 | 8,94 | 8,89 | 8,85 | 8,79 | 8,74 | 8,66 | 8,59 | 8,57 | 8,55 | 8,53 
4 7,711 6,94 6,59 | 6,39 | 6,26 | 6,16 | 6,09 | 6,04 | 5,96 | 5,91 | 5,80 | 5,72 | 5,69 | 5,66 | 5,63 
5 6,61 | 5,79 | 5,41 | 5,19 | 5,05 | 4,95 | 4,88 | 4,82 | 4,74 | 4,68 | 4,56 | 4,46 | 4,43 | 4,41 | 4,37 
6 5,99 | 5,14 | 4,76 | 4,53 | 4,39 | 4,28 | 4,21 | 4,15 | 4,06 | 4,00 | 3,87 | 3,77 | 3,74 | 3,71 | 3,67 
7 5,59 | 4,74] 4,35 | 4,12 | 3,97 | 3,87 | 3,79 | 3,73 | 3,64 | 3,57 | 3,44 | 3,34 | 3,30 | 3,27 | 3,23 
8 5,32 | 4,46 | 4,07 | 3,84 | 3,69 | 3,58 | 3,50 | 3,44 | 3,35 | 3,28 | 3,15 | 3,04 | 3,01 | 2,97 | 2,93 
9 5,12 | 4,26 | 3,86 | 3,63 | 3,48 | 3,37 | 3,29 | 3,23 | 3,14 | 3,07 | 2,94 | 2,83 | 2,79 | 2,76 | 2,71 
10 4,96 | 4,10 | 3,71 | 3,48 | 3,33 | 3,22 | 3,14 | 3,07 | 2,98 | 2,91 | 2,77 | 2,66 | 2,62 | 2,59 | 2,54 
11 4,84 | 3,98 | 3,59 | 3,36 | 3,20 | 3,09 | 3,01 | 2,95 | 2,85 | 2,79 | 2,65 | 2,53 | 2,49 | 2,46 | 2,40 
12 4,75 | 3,89 | 3,49 | 3,26 | 3,11 | 3,00 | 2,91 | 2,85 | 2,75 | 2,69 | 2,54 | 2,43 | 2,38 | 2,35 | 2,30 
13 4,67 | 3,81 | 3,41 | 3,18 | 3,03 | 2,92 | 2,83 | 2,77 | 2,67 | 2,60 | 2,46 | 2,34 | 2,30 | 2,26 | 2,21 
14 4,60 | 3,74 | 3,34 | 3,11 | 2,96 | 2,85 | 2,76 | 2,70 | 2,60 | 2,53 | 2,39 | 2,27 | 2,22 | 2,19 | 2,13 
15 4,54 | 3,68 | 3,29 | 3,06 | 2,90 | 2,79 | 2,71 | 2,64 | 2,54 | 2,48 | 2,33 | 2,20 | 2,16 | 2,12 | 2,07 
16 4,49 | 3,63 | 3,24 | 3,01 | 2,85 | 2,74 | 2,66 | 2,59 | 2,49 | 2,42 | 2,28 | 2,15 | 2,11 | 2,07 | 2,01 
17 4,45 | 3,59 | 3,20 | 2,96 | 2,81 | 2,70 | 2,61 | 2,55 | 2,45 | 2,38 | 2,23 | 2,10 | 2,06 | 2,02 | 1,96 
18 4,41 | 3,55 | 3,16 | 2,93 | 2,77 | 2,66 | 2,58 | 2,51 | 2,41 | 2,34 | 2,19 | 2,06 | 2,02 | 1,98 | 1,92 
19 4,38 | 3,52 | 3,13 | 2,90 | 2,74 | 2,63 | 2,54 | 2,48 | 2,38 | 2,31 | 2,16 | 2,03 | 1,98 | 1,94 | 1,88 
20 4,35 | 3,49 | 3,10 | 2,87 | 2,71 | 2,60 | 2,51 | 2,45 | 2,35 | 2,28 | 2,12 | 1,99 | 1,95 | 1,91 | 1,84 
21 4,32 | 3,47 | 3,07 | 2,84 | 2,68 | 2,57 | 2,49 | 2,42 | 2,32 | 2,25 | 2,10 | 1,96 | 1,92 | 1,88 | 1,81 
22 4,30 | 3,44 | 3,05 | 2,82 | 2,66 | 2,55 | 2,46 | 2,40 | 2,30 | 2,23 | 2,07 | 1,94 | 1,89 | 1,85 | 1,78 
23 4,28 | 3,42 | 3,03 | 2,80 | 2,64 | 2,53 | 2,44 | 2,37 | 2,27 | 2,20 | 2,05 | 1,91 | 1,86 | 1,82 | 1,76 
24 4,26 | 3,40 | 3,01 | 2,78 | 2,62 | 2,51 | 2,42 | 2,36 | 2,25 | 2,18 | 2,03 | 1,89 | 1,84 | 1,80 | 1,73 
25 4,24 | 3,39 | 2,99 | 2,76 | 2,60 | 2,49 | 2,40 | 2,34 | 2,24 | 2,16 | 2,01 | 1,87 | 1,82 | 1,78 | 1,71 
26 4,23 | 3,37 | 2,98 | 2,74 | 2,59 | 2,47 | 2,39 | 2,32 | 2,22 | 2,15 | 1,99 | 1,85 | 1,80 | 1,76 | 1,69 
27 4,21 | 3,35 | 2,96 | 2,73 | 2,57 | 2,46 | 2,37 | 2,31 | 2,20 | 2,13 | 1,97 | 1,84 11,79 | 1,741 1,67 
28 4,20 | 3,34 | 2,95 | 2,71 | 2,56 | 2,45 | 2,36 | 2,29 | 2,19|2,121 1,96 | 1,82 | 1,77 | 1,73 | 1,65 
29 4,18 | 3,33 | 2,93 | 2,70 | 2,55 | 2,43 | 2,35 | 2,28 | 2,18 | 2,10 | 1,94 | 1,81 | 1,75 | 1,71 | 1,64 
30 4,17 | 3,32 | 2,92 | 2,69 | 2,53 | 2,42 | 2,33 | 2,27 | 2,16 | 2,09 | 1,93 | 1,79 | 1,74 | 1,70 | 1,62 
40 4,08 | 3,23 | 2,84 | 2,61 | 2,45 | 2,34 | 2,25 | 2,18 | 2,08 | 2,00 | 1,84 | 1,69 | 1,64 | 1,59 | 1,51 
60 4,00 | 3,15 | 2,76 | 2,53 | 2,37 | 2,25 | 2,17 12,10 | 1,99|1,9211.75 | 1,59 | 1,53 | 1,48 | 1,39 
120 3,92 | 3,07 | 2,68 | 2,44 | 2,29 | 2,17 | 2,08 | 2,01 | 1,91 | 1,83 | 1,65 | 1,49 | 1,42 | 1,36 | 1,25 
œ 3,84 | 3,00 | 2,60 | 2,37 | 2,21 | 2,10 | 2,01 | 1,94 | 1,83 | 1,75 | 1,57 | 1,39 | 1,32 | 1,24 | 1,00 
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Table 7 (suite) — Fractiles d'ordre 0,975 de la loi de Fisher-Snedecor F{v.,,v:). 


Vi 


10 


12 


20 


60 


Lee] 
V2 
1 648 | 800 | 864 | 900 | 922 | 937 | 948 | 957 | 969 | 977 | 993 | 1006 | 1010 | 1013 | 1018 
2 38,5 | 39,0 | 39,2 | 39,2 | 39,3 | 39,3 | 39,4 | 39,4 | 39,4] 39,41 39,4] 39,5 | 39,5 | 39,5 | 39,5 
3 17,4[16,0|15,4115,1 | 14,9 | 14,7 | 14,6 | 14,5 | 14,4 | 14,3 | 14,2 | 14,0 | 14,0 | 14,0 | 13,9 
4 12,2 | 10,6 | 9,98 | 9,60 | 9,36 | 9,20 | 9,07 | 8,98 | 8,84 | 8,75 | 8,56 | 8,41 | 8,36 | 8,32 | 8,26 
5 10,0 | 8,43 |7,7617,3917,15 | 6,98 | 6,85 |6,76|6,6216,52 | 6,33 | 6,18 | 6,12 | 6,08 | 6,02 
6 8,81 | 7,26 | 6,60 | 6,23 | 5,99 | 5,82 | 5,70 | 5,60 | 5,46 | 5,37 | 5,17 | 5,01 | 4,96 | 4,92 | 4,85 
7 8,07 16,54 | 5,89 | 5,52 | 5,29 | 5,12 | 4,99 | 4,90 | 4,76 | 4,67 | 4,47 | 4,31 | 4,25 | 4,21 | 4,14 
8 7,57 | 6,06 | 5,42 | 5,05 | 4,82 | 4,65 | 4,53 | 4,43 | 4,30 | 4,20 | 4,00 | 3,84 | 3,78 | 3,74 | 3,67 
9 7,2115,71 | 5,08 | 4,72 | 4,48 | 4,32 | 4,20 | 4,10 | 3,96 | 3,87 | 3,67 | 3,51 | 3,45 | 3,40 | 3,33 
10 6,94 | 5,46 | 4,83 | 4,47 | 4,24 | 4,07 | 3,95 | 3,85 | 3,72 | 3,62 | 3,42 | 3,26 | 3,20 | 3,15 | 3,08 
11 6,72 | 5,26 | 4,63 | 4,28 | 4,04 | 3,88 | 3,76 | 3,66 | 3,53 | 3,43 | 3,23 | 3,06 | 3,00 | 2,96 | 2,88 
12 6,55 |5,10 | 4,47 14,12 | 3,89 | 3,73 | 3,61 | 3,51 | 3,37 | 3,28 | 3,07 | 2,91 | 2,85 | 2,80 | 2,72 
13 6,41 | 4,97 | 4,35 | 4,00 | 3,77 | 3,60 | 3,48 | 3,39 | 3,25 | 3,15 | 2,95 | 2,78 | 2,72 | 2,67 | 2,60 
14 6,30 | 4,86 | 4,24 | 3,89 | 3,66 | 3,50 | 3,38 | 3,29 | 3,15 | 3,05 | 2,84 | 2,67 | 2,61 | 2,56 | 2,49 
15 6,20 | 4,76 | 4,15 | 3,80 | 3,58 | 3,41 | 3,29 | 3,20 | 3,06 | 2,96 | 2,76 | 2,58 | 2,52 | 2,47 | 2,40 
16 6,12 | 4,69 | 4,08 | 3,73 | 3,50 | 3,34 | 3,22 | 3,12 | 2,99 | 2,89 | 2,68 | 2,51 | 2,45 | 2,40 | 2,32 
17 6,04 | 4,62 | 4,01 | 3,66 | 3,44 | 3,28 | 3,16 | 3,06 | 2,92 | 2,82 | 2,62 | 2,44 | 2,38 | 2,33 | 2,25 
18 5,98 | 4,56 | 3,95 | 3,61 | 3,38 | 3,22 | 3,10 | 3,01 | 2,87 | 2,77 | 2,56 | 2,38 | 2,32 | 2,27 | 2,19 
19 5,92 14,51 | 3,90 | 3,56 | 3,33 | 3,17 | 3,05 | 2,96 | 2,82 | 2,72 | 2,51 | 2,33 | 2,27 | 2,22 | 2,13 
20 5,87 | 4,46 | 3,86 | 3,51 | 3,29 | 3,13 | 3,01 | 2,91 | 2,77 | 2,68 | 2,46 | 2,29 | 2,22 | 2,17 | 2,09 
21 5,83 | 4,42 | 3,82 | 3,48 | 3,25 | 3,09 | 2,97 | 2,87 | 2,73 | 2,64 | 2,42 | 2,25 | 2,18 | 2,13 | 2,04 
22 5,79 | 4,38 | 3,78 | 3,44 | 3,22 | 3,05 | 2,93 | 2,84 | 2,70 | 2,60 | 2,39 | 2,21 | 2,14 | 2,09 | 2,00 
23 5,75 14,35 | 3,75 | 3,41 | 3,18 | 3,02 | 2,90 | 2,81 | 2,67 | 2,57 | 2,36 | 2,18 | 2,11 | 2,06 | 1,97 
24 5,7214,32 | 3,72 | 3,38 | 3,15 | 2,99 | 2,87 | 2,78 | 2,64 | 2,54 | 2,33 | 2,15 | 2,08 | 2,02 | 1,94 
25 5,69 | 4,29 | 3,69 | 3,35 | 3,13 | 2,97 | 2,85 | 2,75 | 2,61 | 2,51 | 2,30 | 2,12 | 2,05 | 2,00 | 1,91 
26 5,66 | 4,27 | 3,67 | 3,33 | 3,10 | 2,94 | 2,82 | 2,73 | 2,59 | 2,49 | 2,28 | 2,09 | 2,03 | 1,97 | 1,88 
27 5,63 | 4,24 | 3,65 | 3,31 | 3,08 | 2,92 | 2,80 | 2,71 | 2,57 | 2,47 | 2,25 | 2,07 | 2,00 | 1,94 | 1,85 
28 5,61 | 4,22 | 3,63 | 3,29 | 3,06 | 2,90 | 2,78 | 2,69 | 2,55 | 2,45 | 2,23 | 2,05 | 1,98 | 1,92 | 1,83 
29 5,59 | 4,20 | 3,61 | 3,27 | 3,04 | 2,88 | 2,76 | 2,67 | 2,53 | 2,43 | 2,21 | 2,03 | 1,96 | 1,90 | 1,81 
30 5,57 14,18 | 3,59 | 3,25 | 3,03 | 2,87 | 2,75 | 2,65 | 2,51 | 2,41 | 2,20 | 2,01 | 1,94 | 1,88 | 1,79 
40 5,42 | 4,05 | 3,46 | 3,13 | 2,90 | 2,74 | 2,62 | 2,53 | 2,39 | 2,29 | 2,07 | 1,88 | 1,80 | 1,74 | 1,64 
60 5,29 | 3,93 | 3,34 | 3,01 | 2,79 | 2,63 | 2,51 | 2,41 | 2,27 | 2,17 | 1,94] 1,74 | 1,67 | 1,60 | 1,48 
120 5,15 | 3,80 | 3,22 | 2,89 | 2,67 | 2,51 | 2,39 | 2,30 | 2,15 | 2,05 | 1,82 | 1,61 | 1,52 | 1,45 | 1,31 
x 5,02 13,69 | 3,12 | 2,79 | 2,57 | 2,41 | 2,29 | 2,19 | 2,05 | 1,9411,71 | 1,48 | 1,39 | 1,30 | 1,00 
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Abaque 1 — intervalles de confiance pour une proportion p. 
Intervalle bilatéral de niveau de confiance 0,90 
intervalles unilatéraux de niveau de confiance 0,95 
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Abaque 2 — intervalles de confiance pour une proportion p. 
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Intervalle bilatéral de niveau de confiance 0,95 
intervalles unilatéraux de niveau de confiance 0,975 
 : xn calculée sur l'échantillon (en pourcentage) 
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